DNA技术可以防止“恶意”电子邮件

日期:2017-10-16 03:08:05 作者:明透歇 阅读:

作者:Danny O'Brien,圣何塞最初设计用于分析DNA序列的技术是反垃圾邮件战争的最新武器一种名为Chung-Kwei的算法(在风水护身符之后保护家庭免受恶灵攻击)可以捕获近97%的垃圾邮件 Chung-Kwei基于Teiresias算法,该算法由位于美国纽约的IBM Thomas J Watson研究中心的生物信息学研究小组开发 Teiresias旨在搜索不同的DNA和氨基酸序列的重复模式,这通常表明具有重要作用的遗传结构研究小组代替了代表DNA序列的字符链,为该算法提供了65,000个已知垃圾邮件的例子每封电子邮件都被视为一个类似DNA的长链字符 Teiresias在这个系列中发现了600万个反复出现的模式,例如“伟哥”每个模式代表一个共同的字母和数字序列,它们出现在一个以上的未经请求的消息中然后,研究人员通过相同的过程运行了一系列已知的非垃圾邮件(称为“火腿”),并删除了两组中发生的模式传入的电子邮件根据其拥有的垃圾邮件模式数量得分只有少量垃圾邮件句子的长电子邮件会得到相对较低的分数;但是,在消息长度上分布有许多模式的人会得分更高 Chung-Kwei正确地将66,697条测试邮件中的64,665条视为垃圾邮件或96.56%更重要的是,它错误地将真正的电子邮件标识为垃圾邮件的速度仅为6000条消息中的1条丢失垃圾邮件中的单个电子邮件是一个过滤器中的失败,而不是偶尔发送垃圾邮件 Chung-Kwei采用常见的垃圾邮件发送者策略来躲避模式识别方案,例如用$替换s,就像“增加你的$ ex power”一样,使用它对不同但功能相同的DNA序列的内置容忍度正如在遗传分析中一样,可以告诉Teiresias CCC和CCU密码子都产生相同的氨基酸,脯氨酸,反垃圾邮件系统可以接受$和s相同的训练 IBM打算将Chung-Kwei纳入其商业产品SpamGuru开发SpamAssassin(最受欢迎的开源反垃圾邮件过滤器之一)的Justin Mason表示,Chung-Kwei看起来很有前景 “我认为还有很多工作要做但令人兴奋的不是特定的算法,而是IBM已经展示了生物信息学技术的整个领域,