*本系统功能模块、字段参数,均可结合用户实际业务需求调整,可增可减,以达到最佳业务管理流程的体验!
编号 | 模块名称 | 字段参数 |
1 | 数据导入 | 文件路径、数据库表名、数据源名称、导入时间、导入者、数据量、数据质量指标、数据源描述、业务标签、数据源类型、数据格式、数据来源等 |
2 | 数据清洗 | 缺失值处理、重复值处理、异常值处理、数据格式化、数据去重、数据标准化、数据拆分、数据转换、数据归一化、数据修正、数据合并等 |
3 | 数据预处理 | 特征选择、特征提取、特征变换、特征降维、数据平滑、数据采样、数据分割、数据归约、数据填充、数据标记等 |
4 | 文本分词 | 中文分词、英文分词、分词器设置、词性标注、停用词过滤、自定义词典、同义词处理、拼写纠错、实体识别、词频统计等 |
5 | 文本特征提取 | TF:IDF、文本向量化、文本主题提取、文本关键词提取、文本摘要提取、文本情感分析、文本情感极性判断、文本相似度计算、文本短语提取、文本分类特征提取等 |
6 | 文本聚类 | K:Means算法、层次聚类算法、密度聚类算法、谱聚类算法、DBSCAN算法、文本聚类评价指标、聚类可视化、聚类结果解释、聚类结果存储、聚类结果导出等 |
7 | 文本分类 | 朴素贝叶斯分类器、支持向量机分类器、决策树分类器、随机森林分类器、K近邻分类器、文本分类评价指标、多分类问题处理、不平衡数据处理、分类结果解释、分类结果存储等 |
8 | 文本情感分析 | 情感词典构建、情感分析算法、情感强度计算、情感极性判断、情感分析评价指标、情感分析结果可视化、情感分析结果存储、情感分析结果导出等 |
9 | 文本关系抽取 | 依存句法分析、命名实体识别、关系抽取算法、关系抽取评价指标、关系图谱构建、关系图谱可视化、关系图谱查询、关系图谱导出、关系图谱存储等 |
10 | 文本挖掘可视化 | 词云可视化、文本分布可视化、文本网络可视化、文本关联可视化、文本聚类可视化、文本分类可视化、文本情感可视化、文本关系可视化、文本挖掘结果展示、自定义可视化配置等 |