AI如何创建和检测假新闻



<div _ngcontent-c15 =“”innerhtml =“

盖蒂

虚假新闻一直如此 在我们周围成长,主要是 clickbait,往往往往病毒。这些文章和故事的创作完全是为了误导和误导人们进入相信的叙述,否则就没有任何价值。根据 研究发表科学 杂志,这种媒体的传播可归因于这样一个事实,即人类更有可能比真相更快地传播谎言。

过去信息的主要来源是记者和真实的媒体,他们必须核实他们的来源和收到的信息;遗憾的是,情况并非总是如此。随着技术的进步,谣言和宣传工厂已被移交给旨在创造可信内容的高级AI算法 – 这通常是不正确的。

这项技术的发展是Siri,光学字符识别或垃圾邮件过滤器的一次重大飞跃,但是教AI来识别大量数据并操纵它是一个危险的命题。

这导致了一个问题:如何检测假新闻?

好消息是,已经开发出用于区分人类和AI生成内容的算法。另一方面,这些算法还具有自己创建虚假新闻的能力。

虚假检测

虽然人工智能似乎是一种相对较新的技术,但它一直在帮助我们对内容进行分类。

垃圾邮件过滤技术– 机器学习算法 – 最初是在1700年代开发的。今天,我们将它用于许多任务,例如对我们的电子邮件进行分类以确定哪些对应有用,哪些只是未经请求的大规模分发。

这也促成了神经网络技术的发展,神经网络技术充当鉴别器,可以检测物品中的差异以确定真实性。

有些人使用类似职位之间的比较分析来检查所包含的信息和事实是否属实,并与可靠来源相匹配。其他人寻找标题和内容之间的差异 – 从而识别clickbait文章。

一个更新的算法仍然是Grover,它 承诺92%的效率 在检测非人类内容。

为什么我们没有达到100%的准确率

这些系统的最大缺点是它们假设假文本总是具有指示标记。

垃圾邮件多少次潜入收件箱?虽然数字可能不高,但不可否认的是,这确实有时会发生 – 主要是因为垃圾邮件内容的创建者不断发展。他们不断弄清楚有助于标记内容并学习避免内容的触发器。

虚假新闻也是如此:随着捕获和消除它的技术变得更好,创建它的算法也变得更好。

这使得那些致力于遏制虚假新闻传播的人和那些产生误导性内容的人之间产生了无休止的反复。

神经网络算法如何学会区分

由于创建此类算法的主要目的是区分真实和虚假信息,开发人员首先需要教会系统这些是什么。

这些AI中的大多数,包括Grover,都是通过从各种虚假新闻数据集中提供现有文章而开发的。这些是巨大的虚拟数据库,包含真实的信息和来源,以帮助AI学习人类写作的模式。

其中一些数据集包括:

•RealNews:此数据集用于训练Grover,并拥有5,000多个需要120 GB空间的正版出版物。

•Kaggle:此数据集占用大约57 MB的磁盘空间,包含13,000行和20列数据。

•George McIntire:以数据可视化分析师命名,这组假新闻数据需要31 MB的磁盘空间。

一旦此过程结束,AI就可以构建复杂的模型,这些模型能够识别某些单词的使用方式以及不同的概念如何链接在一起。

人工智能创造虚假新闻

为歧视性程序创建这些模型的一种重要方法被称为“对抗性”系统。对抗机器学习就是这样 处理 创建可以通过检测程序的恶意或错误信息内容。

Grover和其他AI系统通过生成文章然后使用自己的检测程序来评估文章的可信度来提高效率。如果创建的内容不那么令人信服,那么生成器会继续复制文本并了解什么是真实的,什么不是。

这种“生成”假文章的能力是一把双刃剑。

另一个进步是创造“深度伪造”,这些视觉和人工生成的视频和照片可以将一个人的体格和面部叠加在另一个人身上,使他们看起来像是在执行某种行动。

Deepfakes可能会对误用造成严重后果。从宣传到煽动仇恨和暴力,到通过虚假演讲和篡改视频诋毁公众人物,可以使用深层伪造来制造混乱,并可能导致严重丧失公众信任和不良声誉。

这种滥用的一个主要例子是释放a 篡改视频 Facebook首席执行官马克扎克伯格在他的国会听证会期间。

虽然很难确定这种媒体是否真实,但是对抗这种形式的人工智能操作的技术仍在进行中。

圈可以破碎吗?

虚假的新闻是在没有经过审查和验证的情况下共享的,而这种扩散是创造更多需求的原因。事实上,皮尤研究中心&nbsp;调查 发现10%的受访者承认他们在网上分享他们认为是假的新闻报道,而49%的受访者分享了他们后来发现是假的新闻。

我们现在可以做的是创造意识来对抗假新闻的传播。换句话说,我们必须停止分享此类媒体以剥夺其信誉。

检测假新闻是一个复杂的过程,从认知和教育开始。您必须验证来源。质量信息通常是事实检查或同行评审。您应该依赖来自信誉良好的渠道或来自可信赖的研究公司的见解。

现在,越来越多的人依赖互联网作为他们的主要信息来源。然而,由于这种媒介容易受到大量虚假信息的污染,我们从在线资源中学到的一切都必须经过仔细的质疑和评估。

福布斯通讯委员会 是一个仅限受邀者参与的社区,面向成功的公共关系,媒体策略,创意和广告代理商的高管。
我有资格吗?

“>

虚假新闻一直在我们身边不断增长,主要是作为clickbait,往往会传播病毒。这些文章和故事的创作完全是为了误导和误导人们进入相信的叙述,否则就没有任何价值。据研究报告发表于 科学 杂志,这种媒体的传播可归因于这样一个事实,即人类更有可能比真相更快地传播谎言。

过去信息的主要来源是记者和真实的媒体,他们必须核实他们的来源和收到的信息;遗憾的是,情况并非总是如此。随着技术的进步,谣言和宣传工厂已被移交给旨在创造可信内容的高级AI算法 – 这通常是不正确的。

这项技术的发展是Siri,光学字符识别或垃圾邮件过滤器的一次重大飞跃,但是教AI来识别大量数据并操纵它是一个危险的命题。

这导致了一个问题:如何检测假新闻?

好消息是,已经开发出用于区分人类和AI生成内容的算法。另一方面,这些算法还具有自己创建虚假新闻的能力。

虚假检测

虽然人工智能似乎是一种相对较新的技术,但它一直在帮助我们对内容进行分类。

垃圾邮件过滤器 – 机器学习算法背后的技术最初是在1700年代开发的。今天,我们将它用于许多任务,例如对我们的电子邮件进行分类以确定哪些对应有用,哪些只是未经请求的大规模分发。

这也促成了神经网络技术的发展,神经网络技术充当鉴别器,可以检测物品中的差异以确定真实性。

有些人使用类似职位之间的比较分析来检查所包含的信息和事实是否属实,并与可靠来源相匹配。其他人寻找标题和内容之间的差异 – 从而识别clickbait文章。

较新的算法仍然是Grover,它可以在检测非人类内容方面提高92%的效率。

为什么我们没有达到100%的准确率

这些系统的最大缺点是它们假设假文本总是具有指示标记。

垃圾邮件多少次潜入收件箱?虽然数字可能不高,但不可否认的是,这确实有时会发生 – 主要是因为垃圾邮件内容的创建者不断发展。他们不断弄清楚有助于标记内容并学习避免内容的触发器。

虚假新闻也是如此:随着捕获和消除它的技术变得更好,创建它的算法也变得更好。

这使得那些致力于遏制虚假新闻传播的人和那些产生误导性内容的人之间产生了无休止的反复。

神经网络算法如何学会区分

由于创建此类算法的主要目的是区分真实和虚假信息,开发人员首先需要教会系统这些是什么。

这些AI中的大多数,包括Grover,都是通过从各种虚假新闻数据集中提供现有文章而开发的。这些是巨大的虚拟数据库,包含真实的信息和来源,以帮助AI学习人类写作的模式。

其中一些数据集包括:

•RealNews:此数据集用于训练Grover,并拥有5,000多个需要120 GB空间的正版出版物。

•Kaggle:此数据集占用大约57 MB的磁盘空间,包含13,000行和20列数据。

•George McIntire:以数据可视化分析师命名,这组假新闻数据需要31 MB的磁盘空间。

一旦此过程结束,AI就可以构建复杂的模型,这些模型能够识别某些单词的使用方式以及不同的概念如何链接在一起。

人工智能创造虚假新闻

为歧视性程序创建这些模型的一种重要方法被称为“对抗性”系统。对抗性机器学习是创建可以通过检测程序的恶意或错误信息内容的过程。

Grover和其他AI系统通过生成文章然后使用自己的检测程序来评估文章的可信度来提高效率。如果创建的内容不那么令人信服,那么生成器会继续复制文本并了解什么是真实的,什么不是。

这种“生成”假文章的能力是一把双刃剑。

另一个进步是创造“深度伪造”,这些视觉和人工生成的视频和照片可以将一个人的体格和面部叠加在另一个人身上,使他们看起来像是在执行某种行动。

Deepfakes可能会对误用造成严重后果。从宣传到煽动仇恨和暴力,到通过虚假演讲和篡改视频诋毁公众人物,可以使用深层伪造来制造混乱,并可能导致严重丧失公众信任和不良声誉。

这种滥用的一个主要例子是在他的国会听证会期间发布了Facebook首席执行官马克扎克伯格的篡改视频。

虽然很难确定这种媒体是否真实,但是对抗这种形式的人工智能操作的技术仍在进行中。

圈可以破碎吗?

虚假的新闻是在没有经过审查和验证的情况下共享的,而这种扩散是创造更多需求的原因。事实上,皮尤研究中心的一项调查发现,10%的受访者承认在网上分享他们认为是假的新闻报道,而49%的受访者分享了他们后来发现是假的新闻。

我们现在可以做的是创造意识来对抗假新闻的传播。换句话说,我们必须停止分享此类媒体以剥夺其信誉。

检测假新闻是一个复杂的过程,从认知和教育开始。您必须验证来源。质量信息通常是事实检查或同行评审。您应该依赖来自信誉良好的渠道或来自可信赖的研究公司的见解。

现在,越来越多的人依赖互联网作为他们的主要信息来源。然而,由于这种媒介容易受到大量虚假信息的污染,我们从在线资源中学到的一切都必须经过仔细的质疑和评估。