大家好,关于弱智吧竟成最佳中文AI训练数据?!中科院等:8项测试第一 很多朋友都还不太明白,今天小编就来为大家分享关于的知识,希望对各位有所帮助!
具体而言,使用智障栏的数据训练的大型模型的分数高于百科全书,Zhihu,douban,Xiaohongshu,甚至是研究团队精心选择的数据集。
在8个测试中获得了最高分数,包括QA,头脑风暴,分类,生成,摘要和提取。
没错,论文中的鲁瓦岛是指拜杜·泰巴(Baidu Tieba),一个充满荒谬,怪异和不合理的演讲的中国社区。样式通常是这样的:
最令人发指的是,白痴栏的AI代码功能也超过了使用专业技术问答社区SIFU数据培训的AI的AI代码功能。现在酒吧朋友自己无法理解。
在其他平台上观看的网民也住在班布。
这项研究来自许多大学和研究机构的联合团队,例如中国科学院高级技术研究所,中国科学院自动化研究所和滑铁卢大学。
数据如何在论文中实现这一成就?
弱智发言成指令微调神器
这项研究最初旨在解决中国大型模型培训中的许多问题:
许多中国数据集从英语中翻译而成,并且与中文习惯和文化背景不太吻合。使用AI生成许多数据集,质量很难保证。事实错误很容易发生。即使是手动标记的数据集也存在诸如小数据量和不完整覆盖区域之类的问题。为了解决这些疼痛点,团队直接从中国互联网上的各种知识来源收集数据,例如Zhihu,douban,百科全书,Xiaohongshu等。经过一系列严格的清洁和手动审查,它已构建为高质量和多样化的中国教学指导,并构建了中国的指导数据集Coig-CCIA。
除了探索不同数据源的作用外,团队还从CQIA-Subset中特别提取了本质的子集。
使用各种数据集对Yi系列开源模型进行了零1000件东西,并使用Belle-eval测试集上的GPT-4分数获得了结果。
在较小的YI-6B型号中,纯和智能条形版总数排名第三,这不是很出色。
看来,小型模型尚未能够理解智力低下的本质。
当涉及YI-34B时,精神智障版本的性能遥遥领先。
我只能在重写和数学任务中获得最高分数,但成绩也相对较高。
此外,智障版本还可以在安全评估中排名第二。
研究人员在分析中还提供了简单的猜测:
也许正是精神障碍的问题增强了AI的逻辑推理能力,从而使指令受益于遵循任务。
当然,精神智障并不是这项研究的全部。它的真正贡献是为中国大型模型开发提供高质量的指导微调数据集COIG-CQIA。
通过探索各种中国互联网数据源,本研究为构建中国教学数据集提供了许多有用的灵感。例如,尽管社交媒体数据开放且多样化,但它也具有许多有害信息风险。虽然百科全书数据非常专业,但覆盖范围可能还不够广。
弱智吧上大分
一旦发行了这项研究,网民集体就无法笑。除了“ XSWL,更广泛思维”的纯粹围观者外,一些网民还认真地讨论了智障酒吧具有如此神奇的效果的原因。
每个人都同意的原因之一是智障酒吧问题的“异质性”。
像大脑预告片一样,它增加了说明的多样性,因此它改善了模型的最终性能:
最常见的数据集是在预处理阶段看到的,再次训练它们只会增加过度拟合。
另一个原因是,心灵贴心的栏的数据文本具有高质量,并且单词是准确而简洁的。
一句话中总结了成千上万的单词:以精神智障为简单的笑话集合确实严重低估了其价值!
鸟类食物,否则,每个人都经常使用智力障碍问题来测试大型模型。
实际上,自Chatgpt开始以来,不可能参与大型模型的发展,并且可以被视为这一浪潮的重要见证。
一开始,网民只是用来折磨AI并创建程序的性能。
后来,每个人都发现智力低下的问题充满了陷阱,可用于区分AI功能的水平。
我仍然记得,在2023年初,每个大型模型的第一个版本都不擅长处理这种问题,例如Wen Xinyi在2023年的话:
随后的版本正在越来越好,例如温辛(Wen Xin)在2023年8月的话:
我知道今天,智力低下的问题是每个新发布的大型模型都必须通过的水平,并且被称为智力低下的基准。
秘密塔写猫
Inspo
后来,AI公司本身开始关注,例如Baidu的官方网站举行了Linkage Live广播。
为了取笑大型模型,网民专门收集了精神智障问题的测试集,但他们没想到有一天他们可以转变为训练集。
这个想法确实已经开放了
纸张地址:https://arxiv.org/abs/2403.18058
Reference link: [1]https://x.com/9hills/status/1775358963724554410[2]https://zhuanlan.zhihu.com/p/690640864[3]https://tieba.baidu.com/p/8964992247
– 超过-
正交qbitai·toutiao标志
原创文章,作者:匿名,如若转载,请注明出处:https://www.xinyuspace.com/19202.html
用户评论
从此我爱的人都像你
这也太离谱了吧!我之前觉得“弱智吧”是用来发泄情绪的地方,没想到它成为了最好的中文AI训练数据?简直不敢相信!难道说,我们这些在网络上随心所欲表达的言论都可能被用来培养超级人工智能了吗?
有18位网友表示赞同!
封心锁爱
弱智吧的火热确实说明中国互联网用户对语言表达的需求越来越丰富。中科院的研究结果很客观,也让人看到AI技术的强大潜力。希望未来可以将AI技术更好地服务于人类。
有19位网友表示赞同!
素颜倾城
说实话,我对这个研究结果挺 skeptical 的。仅仅依靠“弱智吧”这一个平台的数据,就能得出结论说它是最佳中文AI训练数据吗?我觉得还有很多其他的因素需要考虑,比如用户群体、数据质量等等。
有8位网友表示赞同!
堕落爱人!
看到中科院的研究很欣慰啊!这证明中国的AI技术在不断进步,越来越领先了。希望未来我们的AI可以帮助我们解决更多实际问题,提高人们的生活质量。
有7位网友表示赞同!
£烟消云散
我有点担心,“弱智吧”的文本风格本身就很粗暴、充满恶意,用它来训练AI会不会让AI变得更危险?
有9位网友表示赞同!
伱德柔情是我的痛。
这说明中国互联网用户对AI的需求越来越高了。中科院的研究也为人工智能的发展提供了宝贵的数据和资源。未来,我们期待看到更多基于中文语境的AI应用。
有15位网友表示赞同!
断秋风
其实我觉得“弱智吧”这种平台应该被监管加强,不能让不良信息随意传播。用它的数据来训练AI,或许会适得其反,让AI学习到一些不应该有的东西。
有20位网友表示赞同!
聽風
挺好奇这个研究是如何进行的,具体使用了哪些方法和指标?希望后续能公开更多关于这项研究的信息,让我们更好地了解中国AI技术的现状。
有7位网友表示赞同!
遗憾最汹涌
我觉得“弱智吧”只是一小部分的中文网络数据,并不能代表整个中文互联网的用户群体。用它来训练AI可能会导致模型偏差,因此需要更加谨慎的研究和处理。
有12位网友表示赞同!
╯念抹浅笑
这真是一个时代的奇迹!以前只听说过西方国家的AI技术强大,没想到中国的AI发展也如此迅速!希望“弱智吧”的成功能成为中国AI发展的里程碑。
有11位网友表示赞同!
蹂躏少女
我很疑惑,“弱智吧”这种地方的数据质量怎么样?难道真的适合用来训练AI吗?我觉得应该更多地关注数据的真实性和可信度。
有18位网友表示赞同!
爱你的小笨蛋
这个研究结果很有意思,让我更加好奇AI技术的未来发展方向!如果AI能够更好地理解中文语境,那么它将会为人们的生活带来更多的便利和智慧。
有8位网友表示赞同!
艺菲
"弱智吧" 作为一种网络文化的产物,是否真的适合成为AI训练的数据?我认为我们需要对AI技术的发展持更加谨慎的态度,不能仅仅为了追求技术突破而忽视伦理问题。
有20位网友表示赞同!
病房
这确实是一个令人惊讶的发现!我以前认为“弱智吧”只是一个娱乐场所,没想到它竟然成为了中文AI发展的助力者!这让我重新思考了网络信息的价值。
有11位网友表示赞同!
花海
我觉得AI技术的发展应该更加全面和理性,不能只注重算法的精确度,而忽视数据来源的影响。我们需要对AI数据的可靠性和安全性进行更严格的把控。
有19位网友表示赞同!
抚笙
这是一个很有意义的研究项目!希望中科院能继续深入探索中文AI技术的应用,为社会发展做出更大的贡献。
有12位网友表示赞同!
半梦半醒i
我有点担心,如果AI被训练得太依赖"弱智吧"这类数据,会不会导致它产生偏见或歧视?
有7位网友表示赞同!
杰克
这说明中国在人工智能领域已经占据了很重要的地位。相信随着技术的不断进步,未来我们的生活将会变得更加智能化和便捷化。(
有9位网友表示赞同!