农业大数据清洗方法比较研究
硕士博士毕业论文站内搜索
全站论文库
硕士博士论文库
普通期刊论文库
分类:
教育论文网
→经济论文→
农业经济论文
→
中国农业经济论文
→
农业经济建设与发展论文
→
农业技术改造、农业技术经济论文
农业大数据清洗方法比较研究
论文目录
摘要
第1-7页
abstract
第7-13页
第一章 绪论
第13-17页
1.1 研究背景
第13页
1.2 数据清洗的研究现状
第13-15页
1.2.1 国外研究现状
第13-14页
1.2.2 国内研究现状
第14-15页
1.3 研究意义
第15页
1.4 研究方法
第15页
1.5 论文框架和技术路线
第15-17页
第二章 数据清洗相关理论概述
第17-26页
2.1 数据质量问题
第17-19页
2.1.1 数据质量的涵义
第17页
2.1.2 数据质量问题的分类
第17-18页
2.1.3 数据质量的评估
第18-19页
2.2 数据清洗简介
第19-24页
2.2.1 数据清洗的定义
第19页
2.2.2 数据清洗的方法
第19-22页
2.2.3 数据清洗的基本流程
第22-23页
2.2.4 数据清洗的评价标准
第23-24页
2.3 数据清洗工具
第24-26页
2.3.1 ETL工具
第24页
2.3.2 领域无关的数据清洗工具
第24-26页
第三章 农业大数据质量分析
第26-38页
3.1 农业大数据
第26-28页
3.1.1 农业大数据的涵义
第26页
3.1.2 我国农业大数据的构成
第26-28页
3.1.3 我国农业大数据的特性
第28页
3.2 农业大数据清洗需求分析
第28-31页
3.2.1 农业大数据质量问题
第28-29页
3.2.2 数据质量问题产生的根源
第29-30页
3.2.3 数据清洗的必要性
第30-31页
3.3 农业大数据质量评估体系设计
第31-38页
3.3.1 数据质量评估的整体框架
第31-32页
3.3.2 数据质量调查评估
第32-34页
3.3.3 数据质量指标法
第34-36页
3.3.4 测量结果分析
第36-38页
第四章 重复数据清洗算法对比
第38-45页
4.1 产生的原因
第38页
4.2 相似重复记录清洗步骤
第38-39页
4.3 字段匹配算法
第39-42页
4.3.1 递归的字段匹配算法
第39页
4.3.2 编辑距离
第39-40页
4.3.3 Smith-Waterman算法
第40-41页
4.3.4 q-gram算法
第41页
4.3.5 算法对比
第41-42页
4.4 相似重复记录检测清洗算法
第42-45页
4.4.1 排序合并方法
第42页
4.4.2 基本近邻排序算法SNM
第42-43页
4.4.3 多趟近邻排序算法MPN
第43页
4.4.4 K-means算法
第43-45页
第五章 基于Febrl的农业大数据清洗实证分析
第45-57页
5.1 Febrl数据清洗工具
第45页
5.2 实验设计
第45-49页
5.2.1 数据源
第45-47页
5.2.2 数据源存在的问题
第47页
5.2.3 数据清洗框架
第47-48页
5.2.4 数据清洗结果评价标准
第48-49页
5.3 实验环境搭建
第49-50页
5.3.1 软硬件环境
第49页
5.3.2 安装Febrl
第49-50页
5.4 字段匹配算法的选择
第50-53页
5.5 数据清洗算法改进及结果分析
第53-57页
5.5.1 SNM算法改进
第53页
5.5.2 实验结果分析
第53-57页
第六章 总结与展望
第57-58页
6.1 总结
第57页
6.2 展望
第57-58页
参考文献
第58-63页
致谢
第63-64页
作者简历
第64页
本篇论文共
64
页,
点击这进入下载页面
。
更多论文
农业大数据清洗方法比较研究
土地规模化经营对农业减缓和适应气
中国与刚果金食品贸易潜力探索
基于引力模型的苏丹芝麻出口研究
四川粮经高效复合种植示范区发展水
我国蔬菜种业产值估算
基于GIS的京津冀休闲农业空间布局研
环境成本约束下的中日水稻生产效率
农业综合开发产业化经营项目扶持方
中国西部农户多维贫困识别与影响因
京津冀蔬菜产业集群发展机制研究
主粮化背景下的马铃薯比较效益研究
基于GAMS的全球一般均衡模型构建及
山东棉农生产决策行为的影响因素研
我国猪肉流通损耗与有效供给研究
北京市猪肉市场价格波动及预警研究
贵州省粮食安全状况评价及生产潜力
中国小麦空间格局演变及其驱动因素
中国牛肉产销环节损耗及可食情况研
粮食生产数量安全预警阈值研究
新疆种棉户参保意愿影响因素分析
农户贫困状态转变及其影响因素分析
大数据在农业领域的探索与应用研究
基于期货期权市场的农产品价格保险
河南省粮食综合生产能力发展水平评
我国食糖进口贸易的大国效应研究—
终极股东控制能力对企业技术创新投
农户风险态度是否影响其信贷配给?
贫困地区农村资金互助社的运营效果
叶绿素生物合成途径终端酶的研究
蜂王浆主蛋白1-3的纯化鉴定及在储存
施用生物炭对土壤热性质的影响及其
小麦品种云麦53和94异-15抗条锈病基
水稻花时的研究新方法探究及其QTL定
水稻氮素营养相关突变体的鉴定及其
油菜含油量调控基因的鉴定
一个控制水稻叶绿体发育基因WLP2的
我国主要粮食市场价格波动区间分析
广州南沙水网乡村植物景观风貌的研
余甘子核仁油不饱和脂肪酸富集及其
百望山森林公园公众号宣教解说系统
1,8-对孟二胺超支化聚醚胺的合成及
承德山地美丽乡村景观改造研究——
平原型森林公园规划设计研究——以
城市河流岸带景观设计研究——以北
城市酒店小微湿地景观设计研究——
纳米SiO
2
复合聚硅氧烷改
城市森林公园游憩服务功能研究与优
湖南省森林植物园环境教育研究与提
安丘乡村人居林景观风貌研究与优化
余甘子果渣的综合利用
森林景观色彩量化软件与最优配比规
君子兰气雾栽培的高效培育技术研究
杉木地理种源遗传多样性和遗传分化
基于文化因素的珠海乡村人居林景观
城镇化地区河流生态景观带风貌特征
毛竹花发育4个时期microRNAs的鉴定
鹅掌楸转录组研究及抗寒基因发掘
高品质合成冰片及关键中间体的合成
毛竹花发育4个时期关键调控途径筛选
中国古代纸质文物的无损化学分析
量子纠缠和非局域游戏
自然丰度
40
K 2D
+<
硅量子点的荧光光谱性质及与微盘耦
二维周期结构薄膜超导转变区输运性
铁基超导体NaFe
1-x
Co
La
2-x
Ce
x
Cu
单斜晶体BaGa
4
Se
7
砷化铟纳米线表面等离激元近场成像
MnNiGa磁性斯格明子的发现和物性调
非金属掺杂氧化钛中光生载流子的红
GaAs光导开关的耐压研究
Ge基InAs/GaAs量子点发光结构探究
农业大数据论文
数据质量论文
数据清洗论文
相似重复数据论文
版权申明
:目录由用户
caitou**
提供,
www.51papers.com
仅收录目录,作者需要删除这篇论文目录
请点击这里
。
|
设为首页
||
加入收藏
||
站内搜索引擎
||
站点地图
||
在线购卡
|
版权所有
教育论文网
Copyright(C) All Rights Reserved