能参与尖端科研的半岛·BOB官方网站ChatGPT怎么才刚过高考一本线?
栏目:行业资讯 发布时间:2024-07-20
 这几天你还在等录取通知书吗?每次高考完,总有一些人特别招人烦。要么是高考博主分享人生感悟,也有复读班常客带你估分,最讨厌的就属一群中年人,在那里看着作文题高谈阔论找存在感。  但他们敢做数学题吗?今年之后,AI大概就会直接断送了这些人吹牛的机会,甚至连张雪峰这样的高考报志愿的投机倒把分子,都再也卖不出去自己两万一套的一对一报志愿指导。  众所周知,河南是人口大省,根据2023年的数据,河南以9

  这几天你还在等录取通知书吗?每次高考完,总有一些人特别招人烦。要么是高考博主分享人生感悟,也有复读班常客带你估分,最讨厌的就属一群中年人,在那里看着作文题高谈阔论找存在感。

  但他们敢做数学题吗?今年之后,AI大概就会直接断送了这些人吹牛的机会,甚至连张雪峰这样的高考报志愿的投机倒把分子,都再也卖不出去自己两万一套的一对一报志愿指导。

  众所周知,河南是人口大省,根据2023年的数据,河南以9605万排名全国第三。相应地,河南也是高考大省,2023年河南高考考生高达1200万人。

  大模型的理科成绩要差很多,最高分还不到480分,大多数大模型的理科总分在400分以下。相比河南理科511分的一本线,大模型尚有较大差距。

  本次大模型高考评测与河南省高考考卷完全相同,按照录取分数线,豆包等三款国产AI成功冲上一本线。但如果豆包同学在河南,恐怕依然上不了一本大学。

  在大模型的各个科目得分中我们不难发现,无论是Chat GPT - 4o还是众多的国产大模型,

  为什么写作无法获得高分?原因是Chat GPT实际上是无法真正理解问题的。Chat GPT所做的是模式匹配,它可以通过算法找到和输入问题相关的信息,然后提取出信息中的答案半岛官方网站。

  还以2024年高考数学卷中的两道题为例,从结果中可以看到,国产大模型几乎全军覆没,只有Chat GPT给出了正确答案,其中一题是这样的:

  甲、乙两人各有四张卡片,每张卡片上标有一个数字,甲的卡片分别标有数字 1,3,5,7,乙的卡片上分别标有数字2,4,6,8,两人进行四轮比赛,在每轮比赛中,两人各自从自己持有的卡片中随机选一张,并比较所选卡片的数字的大小,数字大的人得1分,数字小的人得0分,然后各自弃置此轮所选的卡片(弃置的卡片在此后的轮次中不能使用)。则四轮比赛后,甲的总得分小于2的概率为多少?

  而随着技术的进步,大模型的进步已经能够给出这类抽象问题的答案,但如果你问点复杂的,大模型还是会胡扯。以足球运动员为例:

  其次是大模型回答问题的方式,前文提到过,大模型是通过匹配的方式找寻与之最相关的内容再通过缜密的逻辑组合成答案。

  比如我们让模型画一幅人类肖像,在模型的训练数据中海量的关系证明,眼睛下方是鼻子,鼻子下方是嘴,所以模型很容易通过找寻匹配的方式画出与要求相近的答案。因为结果单一,但文字不然。比如我们提到一款手机,那与之相关的内容可能是电路板,可能是价格,可能是品牌,大模型需要不断地推理,找到最近似的结果。这就是所谓的扩散模型。

  一群来自上海财经大学、哈尔滨工业大学(深圳)、北京语言大学、西安电子科技大学、加拿大皇后大学以及万得信息技术有限公司的博士生或工程师收集了超过三万七千个问题,以及对应的超过8万条人类专家回答和超过4万条Chat GPT回答。覆盖了开放域、计算机、金融、医疗、法律、心理学等多个领域。对比大模型和专家的作答。评判标准是在双盲的情况下看谁的答案更加有用?结果如下:

  一款药物从开始研发到上市销售要经历漫长的时间,极端情况下,有些科学家甚至都看不到“孩子”上市就已经离世。更别说研发期间巨大的资金消耗。所以像《我不是药神》中提到的“格列卫”,也是经历了漫长的岁月。而作为垄断企业的药企,显然不会轻易地交出专利。

  但大模型的出现让这个过程至少提高了36%的速度,其重要的功能就是在推测先导药物分子式这一过程中,通过模型极强的学习和推理能力,极大地加快了发现新的分子式(新药物基础)的过程。

  如果回顾一下AI的上一波浪潮,即移动互联网,不难发现,同样的技术和终端,在商业模式上走上了两条不同的道路。

  再看当下的AI生态,中国的公司更聚焦在终端用户的身上,比如AI虚拟人、AI绘图作画、AI写ppt、AI做淘宝模特图、AI试衣等等。并把上一波浪潮中的经验完美融合其中,比如会员制订阅收费、营销手段等等。移动互联网“先圈用户再赚钱”这个逻辑一直被默默地继承了下来。

  诚然,美国也有多如牛毛的类似公司,比如C.AI(虚拟人)、Notion(写作)、Replica(元宇宙)、Cavana(创意),

  但是目前在硅谷投资行业中更为投资人看好的,并已经实现盈利的却是一些“to B”(面向企业)的生意。

  这项工作以前是由人工完成的,即保险公司致电每一个可以或即将可以上班的员工返回工作岗位。显然这是极其低效的。AI应用在电话回访之后极大地提高了效率和准确性,AI接收医院的医疗信息,找出对应的被保险人,然后拨打电话,无需任何人为干预,一天可以打几百上千个电话。而一旦被保险人返回工作,保险公司便可以停止支付工伤期间的薪水。据统计一年下来,仅这一项应用为该公司节省了至少6000万美元的保费。

  留给中国大模型的机会很多,参加高考不过是牛刀小试,成绩也不会像很多人进了复读班一样,不升反降。AI能为人类提供更精密的推导,更厉害的算力,我们很高兴能看到这些被应用在药物研究、外太空探索之上。中国最大的电子厂全国电子厂排名