快捷导航
查看: 56|回复: 16

百度打字测试软件(中文打字软件)

[复制链接]

1万

主题

0

回帖

1万

积分

论坛元老

积分
11635
发表于 2023-8-23 17:35:05 | 显示全部楼层 |阅读模式
<p data-track="1">
<span style="color: #2E2E2E; --tt-darkmode-color: #A3A3A3;">
    GPT-4让AI更加具有像人一样的能力,AI生成的文本的流畅度也令人惊叹,越来越难以辨识。在这一背景下,AI检测文本工具可以通过对生成文本进行追踪和检测,来识别文本是否由AI生成,这也成为防止大型AI语言模型用于作弊等行为的利器。
   </span>
</p><p data-track="2">
<span style="color: #2E2E2E; --tt-darkmode-color: #A3A3A3;">
    日前,
   </span>
<strong>
<span style="color: #2E2E2E; --tt-darkmode-color: #A3A3A3;">
     复旦大学自然语言处理实验室推出了一款用于AI生成文本检测的测试软件“谛听”(英文:Sniffer),基于黑盒假设,无需大规模监督训练,就能检测AI生成的文本。据该软件的英文版本介绍,对于ChatGPT生成文本的检测率达到80%左右。
    </span>
</strong>
</p><p data-track="3">
<span style="color: #2E2E2E; --tt-darkmode-color: #A3A3A3;">
    实验室负责人邱锡鹏教授3月16日晚间在微信朋友圈上表示:“后续将会在MOSS语言模型开源后,将Sniffer与MOSS进行联动,构成一对矛与盾,相互提升,继续探索大模型的新技术。”
   </span>
</p><p class="pgc-img-caption">
</p><p data-track="4">
<span style="color: #2E2E2E; --tt-darkmode-color: #A3A3A3;">
    上个月,邱锡鹏告诉第一财经记者,如果优化顺利,MOSS将于3月底开源。团队表示,未来“谛听”软件工具还将支持GPT-4等更多大模型等检测,并在检测性能提升后整理公开模型。
   </span>
</p><p data-track="5">
<span style="color: #2E2E2E; --tt-darkmode-color: #A3A3A3;">
    不过团队坦言,由于“谛听”的模型是建立在“黑盒假设”下,因此对于输入文本的来源模型并不知晓,而且与监督训练的分类器相比 ,将仅使用少部分数据进行训练。
   </span>
</p><p data-track="6">
<span style="color: #2E2E2E; --tt-darkmode-color: #A3A3A3;">
    值得注意的是,测试集的检测结果显示,该模型中文检测的准确率低于英文,因此中文检测结果还需要进一步提升。
   </span>
</p><p data-track="7">
<span style="color: #2E2E2E; --tt-darkmode-color: #A3A3A3;">
    根据“谛听”的英文版介绍,在保留的测试集上检测结果显示,识别ChatGPT生成文本的成功率在80%左右,识别人类书写文本或GPT-2生成文本的成功率高于90%;非常短的文本(50个单词或更少)很难被检测到。此外,英文人工编写的示例文本来自维基百科。
   </span>
</p><p data-track="8">
<span style="color: #2E2E2E; --tt-darkmode-color: #A3A3A3;">
    “谛听”英文检测结果分为四类:来自人类; 来自人类、但可能有大模型如GPT-3辅助;来自GPT-3模型;来自GPT-2模型。
   </span>
</p><p data-track="9">
<span style="color: #2E2E2E; --tt-darkmode-color: #A3A3A3;">
    “谛听”中文版的检测结果分为三类:一是“文本是人写的”、二是“文本是人写的,但是也很可能包含AI参与”、三是“文本是出自于AI模型的”。
   </span>
</p><p data-track="10">
<span style="color: #2E2E2E; --tt-darkmode-color: #A3A3A3;">
    3月17日,邱锡鹏对第一财经记者表示:“对ChatGPT级别的中文检测准确率目前只有约40%,不过对于小模型(3B左右的开源GPT-2模型)生成的准确率可以达到90%左右。”
   </span>
</p><p data-track="11">
<span style="color: #2E2E2E; --tt-darkmode-color: #A3A3A3;">
    他解释称,中文检测的准确率低于英文有几个原因。“首先是英文采用的wikipedia数据集进行特征提取,因此覆盖面更广,中文选择的数据质量差一些,这也是我们发布beta测试并且正在改进的地方;第二个是中文大模型的tokenizer(分词器)差异会大一些。”邱锡鹏说道。
   </span>
</p><p data-track="12">
<span style="color: #2E2E2E; --tt-darkmode-color: #A3A3A3;">
    他还表示,关于生成文本检测,国外有一些已经发布的产品,对比下来,针对GPT-2级别的模型,准确率比较高,针对GPT-3级别的模型,检测结果还比较差。
   </span>
</p><p data-track="13">
<span style="color: #2E2E2E; --tt-darkmode-color: #A3A3A3;">
    “一方面是这些模型是黑盒,我们的掌握信息有限,另一方面是这些模型生成质量很高,多样性也很好,尤其是GPT-4出现以后,相比于GPT-3.5,检测难度进一步增加了。”邱锡鹏对第一财经记者表示,“总而言之,在大模型时代,文本检测的机器评测准确率仍然较低,还需要进一步的研究。”
   </span>
</p><p data-track="14">
<span style="color: #2E2E2E; --tt-darkmode-color: #A3A3A3;">
    目前的AI文本检测方式大致可分为两类:黑盒假设和白盒假设。所谓的“黑盒假设”对大型语言模型通常只有API级别的访问权限。因此,这类方法依靠于收集人类和机器的文本数据样本来训练分类模型;“白盒假设”拥有对大型语言模型的所有访问权限,并且可以通过控制模型的生成行为或者在生成文本中加入水印(watermark)来对生成文本进行追踪和检测。
   </span>
</p><p data-track="15">
<span style="color: #2E2E2E; --tt-darkmode-color: #A3A3A3;">
    在实践中,黑盒检测器通常由第三方构建,例如较为著名的GPTZero,而白盒检测器通常由大型语言模型开发人员构建。不过由于“黑盒假设”在数据收集的过程中很容易引入偏见(biases),这些偏见常常会被黑盒分类器作为分类的主要特征。而随着大型语言模型能力的提升,大型语言模型生成的文本和人类的差距越来越小,这会导致黑盒模型的检测准确性越来越低
   </span>
</p><p data-track="16">
<span style="color: #2E2E2E; --tt-darkmode-color: #A3A3A3;">
    此外,对于黑盒检测,用户可以微调他们的模型,改变模型输出的风格或者格式,从而导致黑盒检测无法找到通用的检测特征。
   </span>
</p><p data-track="17">
<span style="color: #2E2E2E; --tt-darkmode-color: #A3A3A3;">
    复旦大学的语言模型MOSS自上个月推出以来备受各界关注。邱锡鹏认为,国外开发者不太可能以中文为主去发展他们的模型,中国要想开发一个大型语言模型的基座,用于国内的信息处理,就必须建设一个中文能力非常强的大型语言模型。
   </span>
</p><p data-track="18">
<span style="color: #2E2E2E; --tt-darkmode-color: #A3A3A3;">
    除了复旦大学之外,包括百度、阿里巴巴在内的中国互联网巨头以及初创公司也都在开发基于AI的大模型技术。
   </span>
</p><p data-track="19">
<strong>
    【来源:第一财经】
   </strong>
</p><p data-track="20">
<strong>
    声明:此文版权归原作者所有,若有来源错误或者侵犯您的合法权益,您可通过邮箱与我们取得联系,我们将及时进行处理。邮箱地址:jpbl@jp.jiupainews.com
   </strong>
</p>

1

主题

2780

回帖

4175

积分

论坛元老

积分
4175
发表于 2023-8-23 18:30:31 | 显示全部楼层
这真是不错,顶给需要的人

1

主题

2682

回帖

4028

积分

论坛元老

积分
4028
发表于 2023-8-23 18:38:08 | 显示全部楼层
小手一抖,积分到手!

1

主题

2488

回帖

3737

积分

论坛元老

积分
3737
发表于 2023-8-23 18:38:08 | 显示全部楼层
好帖,来顶下

1

主题

2492

回帖

3743

积分

论坛元老

积分
3743
发表于 2023-8-24 02:22:17 | 显示全部楼层
找到好贴不容易,兄弟们,顶起!

1

主题

2690

回帖

4040

积分

论坛元老

积分
4040
发表于 2023-8-26 03:45:49 | 显示全部楼层
我抢、我抢、我抢沙发~

1

主题

2594

回帖

3896

积分

论坛元老

积分
3896
发表于 2023-8-26 11:25:16 | 显示全部楼层
我是个凑数的。。。

1

主题

2656

回帖

3989

积分

论坛元老

积分
3989
发表于 2023-8-27 02:06:45 | 显示全部楼层
好好 学习了 确实不错

1

主题

2630

回帖

3950

积分

论坛元老

积分
3950
发表于 2023-8-28 03:29:14 | 显示全部楼层
前排支持下

1

主题

2496

回帖

3749

积分

论坛元老

积分
3749
发表于 2023-8-29 05:36:25 | 显示全部楼层
不错不错,楼主您辛苦了。。。
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

站点统计|Archiver|手机版|小黑屋|聚云老站长 ( 粤ICP备2023011934号-1 )

GMT+8, 2024-5-15 08:22 , Processed in 0.644271 second(s), 24 queries .

快速回复 返回顶部 返回列表