今天,我办公室的同事向我求助。这几天,领导让他查阅大量历史文献。
本单位及其上级的大部分资料和文件都是通过电子邮件/邮件收发的。而且各种格式的PDF/RAR/word/excel/WPS/JPG经常混在一起。
文件名也不规则。有些称为新文档,有些以文档编号命名,有些以文档标题命名。
这难倒他了!
最近几个月的文件他才收到,要用电脑自带的搜索功能慢慢搜索。然而,领导要求的一些文件是几年前的。这些文件中有许多被归档了。如果你在一堆纸质材料里找这些材料,那就像大海捞针!
于是他找我帮忙,看有没有什么捷径可以快速搞定。
方案一,使用邮箱自带的搜索功能。现在常用的邮箱如 *** ,163等。在网页上有搜索功能。直接在电子邮件搜索中输入您要查找的文件标题的几个关键词。比如你想找《关于印发〈计算机技术与软件专业技术资格(水平)考试暂行规定〉的通知》和《计算机技术与软件专业技术资格(水平)考试实施办法》(其文号为[国任部发[2003]39号),可以直接搜索[软件专业技术资格]或[国任部发]这篇文章。
使用此方案,30%的文件被找到。
优点,搜索速度快。
缺点,发现概率低。
选项2,下载所有附件邮件量小,手动一封一封下载也可以。
我朋友这个邮箱有5000多封邮件,不可能手动下载,所以我写了一个程序。下载1天,共5G以上附件。
下载后搜索rar/zip等压缩包,然后解压。然后使用Windows自带的搜索功能进行搜索。
比如你想找《关于印发〈计算机技术与软件专业技术资格(水平)考试暂行规定〉和〈计算机技术与软件专业技术资格(水平)考试实施办法〉的通知》(其文号为[国任部发[2003]39号),可以直接搜索[软件专业技术资格]或者[国任部发]。
但是发现Windows自带的搜索功能非常慢,搜索一次需要10多分钟到半个小时。
所以我找了另一个搜索工具来加快搜索速度。
这一次,效率和准确率都高了很多。
直接搜索【软件专业技术资格】,或者【中组部颁发】。10秒钟就能搜索到结果。
幸运的是,原始文档中的大多数标题都是以文档编号或标题命名的。
所以最后,我和我的同事一起,找到了大约90%的文件。
剩下的10%可能不是邮件发的,或者名字很乱而且是PDF或者图片,真的找不到。他只能默默的去档案馆,一个一个的慢慢找。
但总的来说,这为他节省了很多时间。他还是很开心的。
效果如下
优点:搜索速度快,覆盖面广。
缺点,之一次下载所有邮件(下载后1天)非常耗时。如果内容是PDF或者图片,文件名乱七八糟的,真的搜不到。
如果你有更好的方法,欢迎你的指导。
如果留言的人多,也许我以后会考虑做软件。