新闻
开云体育(中国)官方网站AI 将对自身进行评分-开yun云·kaiyun(全站)体育官方网站/网页版 登录入口
东谈主工智能覆按数据破钞了何如办?
近日,马斯克在酬酢平台 X 上的一场直播对话中默示,东谈主工智能覆按数据如故破钞:
"咱们基本上如故用尽了东谈主类学问的积贮总额来进行 AI 覆按,这种情况大致在前年就如故发生了。"
马斯克的不雅点与前 OpenAI 首席科学家 Ilya Sutskever 异曲同工。前年 12 月,Sutskever 在机器学习会议 NeurIPS 上默示,AI 行业如故达到了他所谓的"数据峰值",覆按数据的缺少将迫使 AI 模子的建立式样发生转移。
不外,濒临数据破钞的逆境,马斯克冷漠了一个可能的贬责有绸缪:
"唯独的补充圭臬是使用合成数据,即由 AI 模子我方生成的数据。通过合成数据,AI 将对自身进行评分,并资历一个自学习的经过。"
事实上,包括微软、Meta、OpenAI、Anthropic 等在内的科技巨头如故运转使用合成数据来覆按 AI 模子了。据信息技艺筹商和参谋人公司 Gartner 预计,2024 年用于 AI 覆按和分析面目标数据中,有 60% 是合成的。
微软最近开源的 Phi-4 模子即是使用合成数据和真正天下数据共同覆按的。谷歌的 Gemma 模子、Anthropic 的 Claude 3.5 Sonnet 系统以及 Meta 最新的 Llama 系列模子也王人遴荐了近似的圭臬。
分析师默示,使用合成数据进行覆按还省略轻松资本。AI 初创公司 Writer 宣称,其险些统统使用合成数据源建立的 Palmyra X 004 模子仅破耗了 70 万好意思元,而比较之下,OpenAI 同等鸿沟模子的建立资本预计为 460 万好意思元。
不外需要谨慎的是,使用合成数据也存在一些潜在风险。一些筹商标明,合成数据可能导致模子崩溃,即模子的输出变得不够"翻新",反而愈加偏颇,最终严重影响模子的功能。由于合成数据是由模子生成的,若是用于覆按这些模子的数据自己存在偏见和局限性开云体育(中国)官方网站,那么它们的输出也会受到相同的影响。
