首页资讯科技 分门别类多种妙招提取混杂数据

分门别类多种妙招提取混杂数据

俞木发方法1:QQ的OCR识图法方法1:QQ的OCR识图法通过查看原始数据可以知道,每个人的手机号位数都是11位,可以先在Excel中调整列宽,使得列宽正好可以显示11位数字,这样人名和电话号码就自动分列顯示了。接着启动QQ并打开截图组件,…

分门别类多种妙招提取混杂数据

玉木发

方法:QQ OCR阅读法。

方法:QQ OCR读图法通过查看原始数据可以知道每个人的手机号是11位。可以先在Excel中调整列宽,使列宽刚好能显示11位数字,这样人名和电话号码就会自动分开显示。然后启动QQ,打开截图组件,对单元格进行截图,点击截图工具栏(即屏幕图像识别工具)中的“文本”进行OCR识别。在右边的识别结果中,可以看到姓名和电话已经自动分离(图2)。

点击QQ识别窗口右窗格中的“转换为在线文档”按钮,根据提示登录腾讯文档,以上识别的数据会自动在腾讯文档中打开。现在,用原始数据检查识别的数据。纠正错误数据后,双击A1单元格,选择所有内容并复制它们(图3)。

返回Excel 2019窗口新建一个工作表,然后将A列的数据格式设置为“文本”。这样,将上面复制的内容粘贴到工作表后,数据分离就完成了(图4)。方法:单词替换法

我们也可以使用Word 2019的查找替换方法提取数据。通过观察原始数据,我们可以知道数据类型主要是汉字和数字,我们只需要在Word中依次替换这两类数据。

首先将数据复制到新建的Word文档中,然后点击开始→替换,在查找内容中输入[one-φ](不带双引号,下同,即查找所有汉字),在替换为中输入“p”(即段落标记),可以点击特殊格式→下面的段落标记。

替换后,按“Ctrl+A”组合键选择所有数据并复制。然后,返回E xc e l并创建一个新工作表。选择B列,将其格式设置为“文本”,然后定位B1单元格,依次点击“开始→粘贴→匹配目标格式”。然后选中B列的数据,按F5打开选择“位置条件→空值”,最后删除所有选中的空单元格,就可以提取电话号码了(图6)。

对于名称提取,需要在图5所示窗口的“搜索内容”中输入“[0-9]”(表示搜索编号)。其余同上。替换后,将其粘贴到图6所示的A列中,并删除空单元格,这样A列和b列中的姓名和电话数据可以分开。要转换为图4所示的格式,只需将电话号码复制到姓名后面,然后在C1: C11区域输入01-11,在C12输入相同的号码:C22,最后按C列排序(图7)。方法:配方提取法。

如果原始数据的格式和字符数一致,比如从某竞品网站复制的信息是类似“商品01订单号139123456789商品02订单号139123456781”的数据,即商品编码+编号,都是7+12=19个字符。现在需要在Excel中将商品名称和订单号分开,先将数据复制到A1单元格中。找到B1单元格并输入1,在B2单元格中输入公式“=B1+7”,在B3单元格中输入“=B2+12”,然后选择B2: B3地区并下拉填充公式(图8)。

转到单元格C1,输入公式“=MID($A,B1,7)”,这意味着从第一个字符开始,从左到右提取A1数据中的七个字符(即提取“商品01订单号”形式的七个字符),继续在单元格C2中输入公式“=MID($A,B2)

本文来自网络,不代表管理窝立场。转载请注明出处: https://www.guanliwo.com/a/zx/63257.html
上一篇如何制作设计日历
下一篇 网云穿app
管理窝

作者: 管理窝

这里可以再内容模板定义一些文字和说明,也可以调用对应作者的简介!或者做一些网站的描述之类的文字或者HTML!

为您推荐

评论列表()

    联系我们

    联系我们

    0898-88888888

    在线咨询: QQ交谈

    邮箱: email@wangzhan.com

    工作时间:周一至周五,9:00-17:30,节假日休息

    关注微信
    微信扫一扫关注我们

    微信扫一扫关注我们

    关注微博
    返回顶部