教育论文网

农业大数据清洗方法比较研究

硕士博士毕业论文站内搜索    
分类:教育论文网→经济论文→农业经济论文中国农业经济论文农业经济建设与发展论文农业技术改造、农业技术经济论文
农业大数据清洗方法比较研究
论文目录
 
摘要第1-7页
abstract第7-13页
第一章 绪论第13-17页
  1.1 研究背景第13页
  1.2 数据清洗的研究现状第13-15页
    1.2.1 国外研究现状第13-14页
    1.2.2 国内研究现状第14-15页
  1.3 研究意义第15页
  1.4 研究方法第15页
  1.5 论文框架和技术路线第15-17页
第二章 数据清洗相关理论概述第17-26页
  2.1 数据质量问题第17-19页
    2.1.1 数据质量的涵义第17页
    2.1.2 数据质量问题的分类第17-18页
    2.1.3 数据质量的评估第18-19页
  2.2 数据清洗简介第19-24页
    2.2.1 数据清洗的定义第19页
    2.2.2 数据清洗的方法第19-22页
    2.2.3 数据清洗的基本流程第22-23页
    2.2.4 数据清洗的评价标准第23-24页
  2.3 数据清洗工具第24-26页
    2.3.1 ETL工具第24页
    2.3.2 领域无关的数据清洗工具第24-26页
第三章 农业大数据质量分析第26-38页
  3.1 农业大数据第26-28页
    3.1.1 农业大数据的涵义第26页
    3.1.2 我国农业大数据的构成第26-28页
    3.1.3 我国农业大数据的特性第28页
  3.2 农业大数据清洗需求分析第28-31页
    3.2.1 农业大数据质量问题第28-29页
    3.2.2 数据质量问题产生的根源第29-30页
    3.2.3 数据清洗的必要性第30-31页
  3.3 农业大数据质量评估体系设计第31-38页
    3.3.1 数据质量评估的整体框架第31-32页
    3.3.2 数据质量调查评估第32-34页
    3.3.3 数据质量指标法第34-36页
    3.3.4 测量结果分析第36-38页
第四章 重复数据清洗算法对比第38-45页
  4.1 产生的原因第38页
  4.2 相似重复记录清洗步骤第38-39页
  4.3 字段匹配算法第39-42页
    4.3.1 递归的字段匹配算法第39页
    4.3.2 编辑距离第39-40页
    4.3.3 Smith-Waterman算法第40-41页
    4.3.4 q-gram算法第41页
    4.3.5 算法对比第41-42页
  4.4 相似重复记录检测清洗算法第42-45页
    4.4.1 排序合并方法第42页
    4.4.2 基本近邻排序算法SNM第42-43页
    4.4.3 多趟近邻排序算法MPN第43页
    4.4.4 K-means算法第43-45页
第五章 基于Febrl的农业大数据清洗实证分析第45-57页
  5.1 Febrl数据清洗工具第45页
  5.2 实验设计第45-49页
    5.2.1 数据源第45-47页
    5.2.2 数据源存在的问题第47页
    5.2.3 数据清洗框架第47-48页
    5.2.4 数据清洗结果评价标准第48-49页
  5.3 实验环境搭建第49-50页
    5.3.1 软硬件环境第49页
    5.3.2 安装Febrl第49-50页
  5.4 字段匹配算法的选择第50-53页
  5.5 数据清洗算法改进及结果分析第53-57页
    5.5.1 SNM算法改进第53页
    5.5.2 实验结果分析第53-57页
第六章 总结与展望第57-58页
  6.1 总结第57页
  6.2 展望第57-58页
参考文献第58-63页
致谢第63-64页
作者简历第64页

本篇论文共64页,点击这进入下载页面
 
更多论文
农业大数据清洗方法比较研究
土地规模化经营对农业减缓和适应气
中国与刚果金食品贸易潜力探索
基于引力模型的苏丹芝麻出口研究
四川粮经高效复合种植示范区发展水
我国蔬菜种业产值估算
基于GIS的京津冀休闲农业空间布局研
环境成本约束下的中日水稻生产效率
农业综合开发产业化经营项目扶持方
中国西部农户多维贫困识别与影响因
京津冀蔬菜产业集群发展机制研究
主粮化背景下的马铃薯比较效益研究
基于GAMS的全球一般均衡模型构建及
山东棉农生产决策行为的影响因素研
我国猪肉流通损耗与有效供给研究
北京市猪肉市场价格波动及预警研究
贵州省粮食安全状况评价及生产潜力
中国小麦空间格局演变及其驱动因素
中国牛肉产销环节损耗及可食情况研
粮食生产数量安全预警阈值研究
新疆种棉户参保意愿影响因素分析
农户贫困状态转变及其影响因素分析
大数据在农业领域的探索与应用研究
基于期货期权市场的农产品价格保险
河南省粮食综合生产能力发展水平评
我国食糖进口贸易的大国效应研究—
终极股东控制能力对企业技术创新投
农户风险态度是否影响其信贷配给?
贫困地区农村资金互助社的运营效果
叶绿素生物合成途径终端酶的研究
蜂王浆主蛋白1-3的纯化鉴定及在储存
施用生物炭对土壤热性质的影响及其
小麦品种云麦53和94异-15抗条锈病基
水稻花时的研究新方法探究及其QTL定
水稻氮素营养相关突变体的鉴定及其
油菜含油量调控基因的鉴定
一个控制水稻叶绿体发育基因WLP2的
我国主要粮食市场价格波动区间分析
广州南沙水网乡村植物景观风貌的研
余甘子核仁油不饱和脂肪酸富集及其
百望山森林公园公众号宣教解说系统
1,8-对孟二胺超支化聚醚胺的合成及
承德山地美丽乡村景观改造研究——
平原型森林公园规划设计研究——以
城市河流岸带景观设计研究——以北
城市酒店小微湿地景观设计研究——
纳米SiO2复合聚硅氧烷改
城市森林公园游憩服务功能研究与优
湖南省森林植物园环境教育研究与提
安丘乡村人居林景观风貌研究与优化
余甘子果渣的综合利用
森林景观色彩量化软件与最优配比规
君子兰气雾栽培的高效培育技术研究
杉木地理种源遗传多样性和遗传分化
基于文化因素的珠海乡村人居林景观
城镇化地区河流生态景观带风貌特征
毛竹花发育4个时期microRNAs的鉴定
鹅掌楸转录组研究及抗寒基因发掘
高品质合成冰片及关键中间体的合成
毛竹花发育4个时期关键调控途径筛选
中国古代纸质文物的无损化学分析
量子纠缠和非局域游戏
自然丰度40K 2D+<
硅量子点的荧光光谱性质及与微盘耦
二维周期结构薄膜超导转变区输运性
铁基超导体NaFe1-xCo
La2-xCexCu
单斜晶体BaGa4Se7
砷化铟纳米线表面等离激元近场成像
MnNiGa磁性斯格明子的发现和物性调
非金属掺杂氧化钛中光生载流子的红
GaAs光导开关的耐压研究
Ge基InAs/GaAs量子点发光结构探究
 
农业大数据论文 数据质量论文 数据清洗论文 相似重复数据论文
版权申明:目录由用户caitou**提供,www.51papers.com仅收录目录,作者需要删除这篇论文目录请点击这里
| 设为首页||加入收藏||站内搜索引擎||站点地图||在线购卡|
版权所有 教育论文网 Copyright(C) All Rights Reserved