314 / 1971-01-01 00:00:00
Research On Multiple Files Input Programming Method Based On Mapreduce
mapreduce
全文被拒
张静 / 吉林大学
张静 / 吉林大学
张静 / 吉林大学
李 原 /
李 原 /
霍严梅 / 吉林大学
李晓原 /
Abstract: Hadoop is a software framework that supports distributed processing for the analysis and transformation of very large data sets. Hadoop can also handle a large number of small files, and many articles have reported the study on the performance of handling small files. This article first carries depth research and detailed introduction on HDFS and MapReduce, and then proposing a programming method that can allows the order of output contents in accordance with the order of input files when processing large numbers of multiple files. It has been proved in the experiment that the method is feasible and effective, meanwhile solving the problem of multiple files input. Through such output, it will bring great convenience in data processing on the later work.
重要日期
  • 会议日期

    01月22日

    2015

    02月23日

    2015

  • 12月20日 2014

    初稿截稿日期

  • 12月20日 2014

    提前注册日期

  • 12月31日 2014

    终稿截稿日期

  • 02月23日 2015

    注册截止日期

  • 04月20日 2015

    摘要截稿日期

联系方式
移动端
在手机上打开
小程序
打开微信小程序
客服
扫码或点此咨询