python用map-reduce(IP地址库匹配省份和城市)

  • IP地址库文件为city.txt大致内容如下: (在HDFS/data139/ods/ip_address/city.txt)

经过数据清洗后得出真实的手机号码并插入当前hive表中

  • python中map和reduce代码如下


     
  • 执行匹配提交mapreduce

     
  • 支付宝打赏
若你觉得我的文章对你有帮助,欢迎点击上方按钮对我打赏
Administrator

Administrator

知人不必言尽,留三分余地与人,留些口德与己。 责人不必苛尽,留三分余地与人,留些肚量与己。 才能不必傲尽,留三分余地与人,留些内涵与己。 锋芒不必露尽,留三分余地与人,留些深敛与己。 有功不必邀尽,留三分余地与人,留些谦让与己。

发表评论

电子邮件地址不会被公开。 必填项已用*标注