大师,首先对你表示感谢,您的软件确实很好用,相似功能的软件都要标价出售,只有您的这一款可以免费提供,实在是难能可贵。
有一个小问题,有些网站搜不到任何地址,我打开了网页源码,发现里面 mailto: 后面是一些诸如 inf 的内容,请问怎么办哪?
网页源码中是这些字符暂时不支持
请给出例子网页,让我们分析一下,麻烦了!
谢谢大师回复。
例子网页的内容如下:
<a href="mailto:myynti@provestis.fi">
&#x 这样的好象是16进制的unicode代码,浏览器可以自动解释将其解释为正常的英文字母。参考(http://zh.wikipedia.org/wiki/Unicode),但是自动抓取的软件却无法进行这样的转换。
能否在软件中固化26个英文字母以及@符号,园点(.)还有小短线(-,_)的对应16进制unicode代码,这样软件就可以将其自动转换为正常字母来保存其邮件地址。