大模型扎堆「赶考」,语文还是国产AI行,文言文能力超过95%考生
量子位 2023-06-09 02:50:38

鱼羊 萧箫 发自 凹非寺

量子位 | 公众号 QbitAI


【资料图】

ChatGPT诞生后的第一场全国高考,考生忙,大模型们也很忙。

这不,高考还没结束,AI挑战高考题就成了刷屏热搜话题,各家大模型都被拉出来写起了高考作文,甚至是参与整场考试。

(不知是不是巧合,Bard还在下午数学高考后,紧急升级了一波数学推理能力……)

结果,竟然有大模型写的作文,把资深高中老师都骗过了!

就在考试当天,百度搜索正在内测的“AI伙伴”,现场直播挑战了一套语文试题。

从“基础题”文言文翻译、阅读填空、古诗词赏析,到“拉分题”微写作和作文,AI伙伴全部上手做了一遍。

结果,当9份“混进”了AI伙伴作品的高考作文送到语文老师庄临旭手上时,他完全没发现有篇是AI写的:

我是真没想到,AI还能写文言文作文

紧接着,AI伙伴展现的文言文理解能力,更是把资深老师吓了一跳:

凭借我的教学经验来看,超过95%的同学没问题。

一整场直播下来,就连围观了AI伙伴考试全程的毕导都感慨:

再来一次高考语文,我可能考不过它……

所以,集成了百度语义检索技术+大模型能力于一身的AI伙伴,整场考试表现具体如何?

咱们一项一项展开来看。

“AI考生”现场挑战语文高考

先来看看大模型的“基础题”——古诗词赏析

面对情感和写法的“找不同”问题,百度搜索AI伙伴胸有成竹,不仅给出了明确的修辞手法,还进一步分析了古诗的来历和情感,属实是阅读理解十分到位了:

再到阅读填空。面对文章解读和“续写句子”能力,AI伙伴同样毫不逊色:

那么,来看看大模型的“拉分题”写微作文,依旧没什么问题!

要是小作文体现不出来,再来看看AI伙伴作诗的能力。不仅现代诗手到擒来,甚至连藏头诗都能搞定:

不过,要是再仔细一点搞搞提示词工程,AI伙伴似乎就答得更好了。

以高考语文题目中的古诗词理解为例,这里我们先在不给提示词的情况下,把题目原样“喂”给AI伙伴:

AI伙伴给出来的答案虽然也不错,但对于高考题目来说,这答案着实有亿点长,也有点太仔细了:

接下来,给AI伙伴换上强调“最重要的三个意象”的提示词。

果然,AI给出了更精准的回答,指出包括病柏、丹凤和鸱鸮在内的三个意象,是最关键的:

但是,上述都还只是直播中展现出来的效果。像AI伙伴这类有大模型加持的功能,其使用效果是否真的和提示词工程强相关?

为了测测AI伙伴的“真正实力”,我们亲自上手测了测它做高考题的效果。

直播中已经做过了全国甲卷的作文题目,那么我们再来试试今年上海卷的作文。

第一轮,我们直接把题目甩过去:

看起来,AI伙伴虽然理解了文章“主旨”,但写出来还差点意思:论点不够明确,作文的结构也不太清晰。

第二轮,我们试着换了一下提示词,给AI伙伴设置一个“角色扮演”效果。

首先,强调它是一名高考考生,然后给它“灌输”一些高考作文的写作技巧:

这一轮,AI伙伴写得就有高考作文内味了。

不仅给出了10字以内的标题,还按照总分总、夹叙夹议的方式,很好地写出了一篇议论文:

看起来,挖掘大模型的潜力,很大程度上确实要依靠提示词工程。

在直播中,百度集团副总裁、搜索平台负责人肖阳还给我们列举了一个非常简洁的提示词公式:

提示词 = 任务 + 角色 + 上下文背景 + 细节补充。

有了它,不用再担心大模型输出和设想无关的答案了。

当然,作为百度“用大模型重塑搜索能力”的终极杀器,AI伙伴能实现的功能,也远不止是做做高考题而已。

最早在2023万象·百度移动生态大会上官宣发布的AI伙伴,目前已经开启内测,获得试用资格后,可以直接从百度搜索界面进入:

它的本职工作,更像是一个搜索引擎端的全能AI助理,不仅具有智能搜索能力,还兼具创作生成技艺:

一方面,AI伙伴相当于一个对话版智能搜索工具。用它查资料,不需要再按关键词搜索,直接“用人话”提问就行:

不仅如此,每一句回答都有理有据,如果想要“追根溯源”,直接点链接就能跳转到对应的网站:

这样一来,就不用担心它会出现像ChatGPT整理文件那样,出现“无中生有”一些案件的操作了。

另一方面,它又相当于一个多模态大模型创作助手

不仅可以帮助查资料、写周报、画头像,还能陪你模拟面试、甚至替你约会(?)。

这里我们借助AI伙伴的“程序猿小助手”,来试试生成一段代码的能力。

以面试可能会考到的冒泡排序算法为例。

很快啊,几乎没有怎么思考,AI伙伴就给出了一段带注释的冒泡排序算法,最关键的是,它自己已经运行过,并成功输出了一段结果

这意味着我们不需要再自己去跑一遍这段代码,而是能直接将它交给面试官了(doge)

从上面这些展现的能力来看,AI伙伴所能做到的,远非仅仅提供高考试题“参考答案”而已。

这次选择用它挑战高考题,大家伙可能看的是个新鲜劲儿,但“术”的表象之外,更值得关注的是“道”的变化:

使得AI伙伴能在高考题面前依旧“神采飞扬”的大模型技术,正在以搜索引擎的代际变革为基点,席卷各行各业,甚至改变每个人的工作方式。

正如ChatGPT搅动风云之初,微软CEO纳德拉预测的那般:搜索正面临巨变。

并且变化的不仅仅是搜索的技术、产品本身,这一次,更与每一个个体有了更紧密的关联。

搜索三变

百度CEO李彦宏同样认为,“大模型即将改变世界”。基于这样的判断,李彦宏2023年一季度OKR,便指向了“引领搜索体验的代际变革”。

现在,三个月过去,大模型究竟如何变革搜索,现在答案已经越来越清晰。

从技术的角度出发,大语言模型的爆发,正在重新定义人机交互

对于人类而言,最自然的交流方式就是语言沟通。而大模型的代际突破,最直观的一点体现,就是机器自然语言聆听表达能力的飞速提升。

回答来自百度搜索AI伙伴

搜索本身,就是一种人机交互的核心方式。其本质的技术追求,就是要让机器更高效地理解、推理、表达,化复杂问题为直观的第一条搜索结果。

因此可以说,大语言模型的突破,正在全面激发搜索全新的潜能。

值得关注的一点是,伴随着AI的发展,搜索始终都是最前沿AI技术最先落地的场景。

以百度搜索为例,围绕“降低用户表达需求门槛”、“降低用户获取内容和服务的门槛”、“丰富搜索引擎的内容供给”这三个目标,百度搜索一直在AI技术上大量投入。

引入大模型之前,百度搜索已经实现:

千亿级全网索引;

全球领先的深度语义理解技术,相关成果曾获2020年国家技术发明奖二等奖;

最大中文知识图谱,覆盖50亿实体。

从产品的角度看,过去三个月,数据已经证明,对话式搜索正在成为搜索引擎市场的一个新变量。

百度集团副总裁、搜索平台负责人肖阳就透露,大模型加持下的AI伙伴,在内测阶段就已爆火,相关搜索问答量激增。

这进一步佐证大模型带来的新人机交互方式,更能满足人们对搜索“快速”、“有效”的诉求。

牵一发而动全身,在现在这个时间节点,围绕搜索的内容生产和创作领域,创新模式也开始逐渐显现,并被积极地探索实践。

同样是在万象大会上,百度搜索还配合AI伙伴,推出了AI BOT解决方案。目的就是向内容、服务生产者释放大语言模型和AI技术能力,降低其与新搜索模式融合的门槛。

具体来说,百度搜索提供了创作者、商家、机构、服务和品牌等各类型的AI BOT,让他们能够利用自身优势和独特的内容、知识、服务,创造虚拟分身,直接回答用户的问题。

在技术和产品之外,更与每个人息息相关的,是用户搜索方式的改变

正如前文所展示的,大模型时代,“提问题”的能力正在变得越来越关键。

体现在现阶段,就是提示词写得好不好,会直接影响搜索生成结果的质量。是否掌握提示词工程能力,就像互联网时代开启时,是否掌握搜索能力一样关键。

对此,肖阳提到了“搜商”的概念:

未来不仅要卷智商、情商,还要卷“搜商”。

更好地使用提示词,更好地使用AI伙伴,获得的优势会越来越大。

也就是说,找到合适提示词的能力越强,越能在大模型落地应用的时代里,充分利用大模型的强大生产力。

可以说,大模型刮起的时代风暴之下,搜索三变,既是内在技术瓶颈的代际突破,亦是外在人类接触信息方式的彻底变革。

无怪乎肖阳作为技术变革的一线亲历者,会有这样的判断:

语义检索技术与大语言模型结合,促进搜索的理解、推理、组织和创作潜能进一步释放,有望在多方面催生颠覆式创新,促成搜索奇点降临

并且这一次,或许每一个人都会真真切切感受到这种代际变革带来的影响。

One More Thing

说起来,就在高考这两天,AI加持下的百度搜索,忙的还不止有刷题这件事儿。

每年此时,百度都会启动专门的高考服务,通过搜索和AI核心技术,为考生和家长提供便利。

今年,百度还基于AI技术,首次推出了高考搜索指数,涵盖专业搜索热度及变化趋势、“院校PK”等信息。考生家长在择校选专业的时候,可以更方面地参考对比。

AI志愿助手也进行了重大升级,能更直观地展示志愿预测结果,提供相关数据来辅助考生家长做决策。

对了,利用高考搜索指数和其他高考相关搜索数据,百度还联合中国教育在线掌上高考发布了不少有意思的数据:

高校方面,搜索热度最高的本科院校里,南方高校霸榜双一流和非双一流大学前十。

专科院校中,山东是搜索职业教育最多的省份。

专业方面,医学搜索热度断层第一,航空航天热度攀升最快。

而最有“钱”景的,是船舶电子电气工程……

大模型扎堆「赶考」,语文还是国产AI行,文言文能力超过95%考生

2023-06-09 02:50:38

GPLP投融资:芯享科技获1.5亿元 蓝固新能源获1亿元

2023-06-09 02:14:42

北京市通信管理局就网络安全问题约谈有关企业 天天即时看

2023-06-09 01:35:53

当前快播:pcr是什么意思的缩写_pcr是什么意思

2023-06-09 01:17:46

周小川:上海国际金融中心建设迈出更大步伐需要提升人民币自由兑换度

2023-06-09 01:02:15

驾乘质感与智能体验并重,高性能电动SUV长这样! 世界速看

2023-06-09 00:47:04

航班增加 机票价格回落 国内民航市场加快复苏进程 环球信息

2023-06-09 00:07:59

移远通信2022年年度每10股转4股派10元 股权登记日为6月14日

2023-06-09 00:09:55

环球视讯!如果用一人代表梁山108将,你觉得是谁?书中一开始就给出答案!

2023-06-09 00:07:13

一汽解放5月中重卡销量同比增长137.9%,保持稳健复苏势头

2023-06-08 23:14:22

全球热讯:雅视光学(01120):吴逸珊获委任为执行董事

2023-06-08 22:58:58

李云泽:真正实现监管“全覆盖、无例外” 持续整治金融市场乱象|通讯

2023-06-08 22:31:30

世界新动态:唐德影视:股东吴宏亮计划减持公司股份不超过2.04%

2023-06-08 21:59:46

“双倍价值观”贯彻始终,长安欧尚Z6第10万台下线-世界时快讯

2023-06-08 21:29:25

报告称谷歌成日本安卓手机市场占有率最高的品牌,索尼退居第五 环球滚动

2023-06-08 21:05:12

前沿热点:上海两男子往车窗塞露骨小卡片被刑事拘留,警方:他们与诈骗分子勾结

2023-06-08 20:42:51

gtx1650和rtx3050显卡对比介绍

2023-06-08 19:43:01

土方开挖计算公式计算表_土方开挖计算公式

2023-06-08 18:35:59

广东招考在线小程序高考成绩查询入口(含流程)

2023-06-08 18:16:32

毕业生就业推荐表辅导员意见_毕业生就业推荐表_天天热议

2023-06-08 17:47:05

浦发银行合肥分行开展普及金融知识进校园活动

2023-06-08 17:11:02

2023年高考全国共设7726个考点 34.5万个普通考场_动态

2023-06-08 16:15:00

青岛交通执法支队青岛地铁搭建“党建共建,业务联建”平台 动态焦点

2023-06-08 16:09:25

孕妇吃椰子有什么坏处对于肚子里的胎儿来说?

2023-06-08 15:40:01

第六届中外学生设计作品展在沪开幕

2023-06-08 12:41:50

【楚天评】东湖评论:让河湖长制促进河湖长治

2023-06-08 12:26:04

定向推广软件(定向推广)

2023-06-08 11:20:09

【寻味中华|饮食】宁阳“四八席”:一张八仙桌 品味古今礼

2023-06-08 10:31:29

天天快资讯丨今日79股涨停 主要集中在电子、传媒等行业

2023-06-08 08:28:00

2022年中国买走全球30%的存储芯片,约3000亿元,自给率约15% 世界快看

2023-06-08 08:04:42

腾讯QQ回应“QQ空间新版太难用” 短讯

2023-06-08 07:42:54

让老小区焕发新生,“三驾马车”齐发力|共建美丽家园 共享美好生活 天天快讯

2023-06-08 07:19:03

兴齐眼药受邀参加2023人民健康大会·国民视觉健康论坛

2023-06-08 06:40:34

海通国际:给予珍酒李渡(06979.HK)“增持”评级 目标价11.90港元 天天快讯

2023-06-08 06:21:59

美国银行业上演大吃小 大型银行规模Q1进一步膨胀

2023-06-08 06:06:02

每日消息!@所有人 一起为每一位考生送上祝福!

2023-06-08 05:24:14

龙盛世纪(834037):第三届董事会第十一次会议决议公告(更正公告)|全球观焦点

2023-06-08 04:57:47

征和工业:公司浙江项目目前已签署《国有建设用地使用权出让合同》,资金来源为公司自有或自筹资金(包括但不限于通过银行贷款、股权融资等方式)

2023-06-08 04:57:10

昆船智能06月07日主力资金大幅流出

2023-06-08 03:58:56

2023高考数学开考,考生沉着进入考场|天天百事通

2023-06-08 03:32:58

焦点观察:英国5月房价同比下跌1%,为11年来首次年率下跌

2023-06-08 03:26:47

世界即时:像iPhone一样划时代?AppleVisionPro暂时做不到

2023-06-08 03:20:26

【环球速看料】快手极速版如何发布作品 快手极速版发作品方法介绍

2023-06-08 03:16:06

快手极速版老出现广告怎么办 快手极速版关闭广告方法介绍-全球观热点

2023-06-08 02:48:27

高考开战,哪台车能让考生好好午休一下?

2023-06-08 02:50:26

世界要闻:新旧动能顺畅切换,中德企业探索可持续发展合作

2023-06-08 02:44:35

机构:科网股二季度业绩在低基数下增速或更高 依次推荐五只龙头股

2023-06-08 02:02:39

欧盟将对实施“经济勒索”的国家加征关税是针对中国?外交部回应

2023-06-08 01:11:45

青达环保(688501.SH):2023年公司将根据实际需求情况对人员进行相应的补充

2023-06-08 00:34:22

中国联通数字技术助力信息无障碍和适老化改造-热点

2023-06-08 00:10:56

中国驻日本使馆发言人就福岛核污染水排海问题发表谈话 当前独家

2023-06-08 00:23:01

全球速讯:清空购物车文案_清空购物车摇奖机会

2023-06-08 00:16:15

广东:住房政策向多子女家庭倾斜 进一步制定实施差异化住房租赁和购买房屋的优惠政策 环球观察

2023-06-07 23:50:03

全球快看点丨金禄电子涨20.01%

2023-06-07 23:49:24

天人临世(北京)科技有限公司入围《信用中国》栏目_天天快播

2023-06-07 22:58:32

跌跌不休 创业板再创年内新低!借基抄底注意这三点

2023-06-07 22:52:04

广东:加快发展保障性租赁住房,对子女较多家庭适当提高租赁补贴标准|每日速讯

2023-06-07 22:09:46

最新快讯!广州启动一级保供电护航高考,25辆应急发电车进驻考场

2023-06-07 21:52:54

树牢底线思维 强化风险防控 坚决遏制校园安全事故发生-世界简讯

2023-06-07 21:14:00

建工修复拟定增募不超2.25亿元 2021年上市募3.04亿元_世界消息

2023-06-07 21:21:45

kc2005发信息对方会知道你是谁吗_kc2005

2023-06-07 21:22:43

愿做生态文明追梦人 ——记全国林草系统先进工作者潘雪雷

2023-06-07 20:59:18

天天速递!推动实现“家门口的幸福”!苏州相城黄桥街道聚力党建便民服务

2023-06-07 20:19:25

房地产复苏放缓  政策支撑可能性提升 天天百事通

2023-06-07 20:08:55

每日观点:普洱市安排部署公共机构节能工作

2023-06-07 20:07:07

大连高考成绩什么时候出来|环球关注

2023-06-07 19:38:29

异动快报:日播时尚(603196)6月7日14点41分触及涨停板-每日热闻

2023-06-07 19:12:43

拟表彰!名单公布

2023-06-07 18:53:28

大晟文化06月07日主力资金大幅流出 聚看点

2023-06-07 19:00:15

抖音月付算不算网贷?算是一款不能提现的网贷|全球报资讯

2023-06-07 18:41:02

最高人民法院关于将刑事案件判决书抄送当事人所在单位的通知_对于最高人民法院关于将刑事案件判决书抄送当事人所在单位的通知简单介绍

2023-06-07 18:33:38

电脑键盘怎样转换中文

2023-06-07 18:02:35

环球热消息:爱乐达:关于部分限制性股票回购注销完成的公告

2023-06-07 17:56:22

金埔园林:目前公司拥有国家专利74项,致力于形成涵盖“水、路、绿、景、城”五大元素的全方位专利布局|当前短讯

2023-06-07 18:01:05

景津装备:公司产品可用于养殖行业的屠宰、粪便污水及沼渣沼液处理等

2023-06-07 17:47:42

空调制热效果不好_空调制热效果不好_环球实时

2023-06-07 17:25:38

一杯两用:佳适高颜值大容量大肚杯1300ML 19.9元-焦点报道

2023-06-07 17:33:48

让人看了狂点头的文案

2023-06-07 17:28:05

国企领导出差带“小三”逛街?中央巡视组回应:将督促查实

2023-06-07 17:03:51

全球热点!lenovos2002打印机驱动(lenovos820)

2023-06-07 16:22:40

东北三省首家皮肤松弛诊疗中心于长春成立_天天观察

2023-06-07 16:05:10

左旋肉碱的功效与作用

2023-06-07 15:36:06

环球视点!队报:被传回到英超,但贡多齐不一定离开马赛

2023-06-07 15:26:29

内地房地产行业周报:市场成交波动延续,核心二线放宽限购

2023-06-07 15:11:56

【全球时快讯】伊朗驻沙特大使馆重新开馆

2023-06-07 14:49:01

下考第一餐吃什么?湖南这个考点的后厨有市监人员把关!-每日看点

2023-06-07 14:20:11

pt950和au750哪个保值(au750和pt950哪个好)

2023-06-07 14:16:34

许昌市魏都区委书记何长成主持召开书记专题会_环球聚看点

2023-06-07 14:17:54

环球时讯:海南三亚发布暴雨红色预警 幼儿园、中小学停课

2023-06-07 13:31:04

亚华电子:6月6日融资买入1672.01万元,融资融券余额2724.6万元

2023-06-07 13:14:13

镜头下的毕业季丨南华大学毕业生喜迎多彩“毕业礼”

2023-06-07 12:37:35

实力认可|亿达科创荣获富士胶片“最佳 供应商奖”|当前报道

2023-06-07 12:32:05

【世界独家】笔记本网卡每月要交费吗 笔记本上网卡一个月多少钱

2023-06-07 12:06:53

说李世民是一个明君 ,把唐朝治理的井井有条,他是功大于过对吗-天天报资讯

2023-06-07 11:22:47

微信中的文件过期了打不开怎么办_微信中的文件过期了怎么办 微速讯

2023-06-07 10:10:06

演出的演去掉三点水念什么_演去掉三点水念什么

2023-06-07 09:19:39

安德烈·吉申科 环球热推荐

2023-06-07 08:53:21

今日聚焦!福特汽车接近达成出售德国工厂协议

2023-06-07 07:42:57

开创电气(301448.SZ)IPO定价18.15元/股 6月8日开启网上申购

2023-06-07 07:42:23

观天下!云南省丽江市2023-06-04 15:01发布大风蓝色预警

2023-06-07 07:16:55