2023-04-27 11:38:11 来源:智嗨网
撰文 |王语妤
编辑 | 杨博丞
题图 | IC Photo
(资料图片)
最近,昆仑万维和百度“杠”起来了,原因还是因为最近大火的大语言模型。
4月17日,昆仑万维正式推出“天工”大模型,并于当日开启测试邀请。彼时,昆仑万维对外的宣传用语是“中国第一个真正实现智能涌现的国产语言大模型。”
有意思的是,百度在发布文心一言的时候,对外输出的宣传用语是“国内首家做出大语言模型产品的科技互联网大厂”。
从表面上看,两家的宣传语中心不一样,话术也有所不同,看似风平浪静,但实则内核都是在争一个“首家”。
为什么要争“首家”,除了能力的对比,市场的争夺外,还有振奋股价,提高市值的作用,百度消息公布当天,港股股价大涨15%,昆仑万维也一样,官宣第二天股价涨幅达到7.68%。
不过,究竟谁是国内首家呢?
从项目披露时间来看,百度是在去年9月份左右开始去内部推进文心一言项目,到今年2月初正式放出项目的消息,并于3月中旬正式对外官宣了文心一言。
昆仑万维官方并没有公布具体的项目开始时间,但是从2020年开始,昆仑万维就已经开始布局AIGC领域。
从技术层面来看,文心一言背后,百度在人工智能领域有四层架构、全栈布局,包括底层的芯片、深度学习框架、大模型以及最上层的搜索等应用。另外,深耕人工智能领域多年的百度,拥有产业级知识增强文心大模型ERNIE,具备跨模态、跨语言的深度语义理解与生成能力。
昆仑万维同样具备大模型四要素:数据、算力、算法以及大参数语言模型。据昆仑万维介绍,天工是双千亿参数训练的结果——千亿预训练基座模型、千亿RLHF模型。
不过,既然两家的底座能力看起来不相上下,那么我们就将这两家放在一起,试试“内功”。
01、中文语意理解能力
昆仑万维对外展示的技术路径现实,天工团队引入模特卡洛搜索树算法后,在语意理解、转换话题能力上有所提升。
在此背景下,我们首先和天工玩起了成语接龙游戏。不过,天工的完成度并不好,甚至没能理解什么是成语接龙。
文心一言在成语接龙上的表现是优于天工大模型的。
紧接着,我们向文心一言和天工大模型抛出了一个问题——“写一本类似《人世间》一样题材宏大,展现中国历史变迁的小说提纲,字数1000字左右。”对于这个问题,文心一言和天工都将问题的重心放在了“题材宏大”、“历史变迁”这两个关键词上。
于是,两家生成的内容都不符合我们最开始的预期。
上图“天工大模型”,下图文心一言
这个问题,或许是由于我们给出了一定的误导性,所以导致两家生成的答案都不尽人意。但是,天工稍微比文心一言好一些,原因在于,文心一言将“历史变迁”直接解读成了朝代变迁。
尽管天工的回答也是文不对题,但是有人物设定,朝代设定,内容的可操作性和延展性明显是优于文心一言。
将问题拉回《人世间》类似的小说提纲,我们改变了提问角度,连续发文:《人世间》讲了一个什么样的故事、那你能写出类似题材的小说提纲么?大概1000字左右
在提取重点、联想写作、以及话题的连续性上,天工的表现还是不错的。
但是文心一言就“开了小差”。
文心一言的回答出现了明显的错误。不过,我们再一次将问题抛给文心一言,重新生成答案。这一次,文心一言又重回正轨,给出了相应的答案。
此外,我们还用三个连续性问题,向天工发问。此前,我们在《大评测!ChatGPT 、文心一言和Bard谁更强?》中,将同样的问题给到过文心一言、Bard、以及ChatGPT。
可以说,天工的前两个问题回答和文心一言此前的回答不相上下,但在最后一个藏头诗的理解上,还是存在一定的偏差。
尽管,文心一言的藏头诗回答的也并不好,但好在,文心一言理解了“藏头”的意思。而天工,似乎还并未消化掉“藏头”的意思。
02.逻辑思辨能力
为了测试“逻辑推理”能力,我们将这样一题抛给了天工和文心一言,即“如果猫会爬树,那么狗也会。”
上图“天工大模型”,下图文心一言
很明显,天工和文心一言也陷入了题目的误区,或者说,并没有完全理解题目意思。不过,这里需要强调的是,在鸡兔同笼问题上,文心一言和天工在发布的视频中都有不错的表现。
在文心一言发布会上,李彦宏询问文心一言“鸡兔同笼”的问题,在题目数据错误的前提下,文心一言通过推理证明了题目存在问题。
这里需要注意的是,在这个逻辑推理上,ChatGPT的回答,是天工、文心一言、bard这四家大模型中唯一正确的,并指出了猫和狗的不同,证明猫会爬树,而狗不会。
除了考验逻辑能力之外,我们还将一个哲学思辨问题,同时向天工和文心一言发文。
上图“天工大模型”,下图文心一言
在哲学问题的理解上,天工和文心一言区别不大,但文心一言略显“人文”一些,在解读之后,更是直接告诉我们该怎么做,更像是和人在对话一样,天工的回答则更是一本正经。
可以这样来说,和天工对话像是和老师对话,老师需要回答这个问题是什么;和文心一言对话则更像是和心理医生对话,医生需要在解释的基础上给出意见。
03.编程能力
为了测试这两大模型写代码的能力,我们询问了一个非常简单的问题——x+2=5,y-3=7,输出x+y等于几,用java做一个简单编程,并得出结果。
上图“天工大模型”,下图文心一言
但是很显然,这两大模型给出的结果都是有问题的。
不过,在其他评测稿件中,文心一言和天工在编程能力的表现上并不差。我们认为,目前来看,这些大模型的能力还并不稳定,还需要在不断的训练中提高准确性。
结语
总结来看,文心一言也好,天工也罢,他们的能力相对来说,差距不大。但更多的问题在于,目前,大模型每一次生成的问题答案都存在一定的误差。
相比于“首家”之争,我们认为,企业们更重要的是在于提升大模型的能力和准确度,并且寻找到更多合适的场景去实现商业化。
大模型赛道愈发热烈,谁都想做风口上的猪,但是能在风口上起飞的猪,往往都是做好了充足的准备。
此外,我们还应该多给国内科技企业更多的信心,和国外ChatGPT4相比,国内大模型还是有一定差距,但是我相信,这个差距在不远的将来,在竞争中,都会逐渐拉小。国内大模型,未来可期。
标签:
- 加快虚拟仿真实训基地建设 启动职业学校信息化建设试点很必要
- “双减”后如何在满足学生多样需求方面做“加法”?
- 处于生理活跃期且心理发展不成熟 高校开设公共卫生必修课很必要
- 打造高水平人才队伍 爱与希望的种子正在西部地区发芽
- 河南封丘“学生餐后呕吐腹泻”调查:配餐点“未批先餐” 家长盼说法
知识
- 他把银行卡卖给骗子,“黑吃黑”“截胡”十万元
- “老司机”4S店试驾豪车 结果油门当刹车撞了
- 新开工改造城镇老旧小区5.34万个
- 发动巡河志愿者2万余名 “用心护好每一条河”
- 假客服的套路:伪装成大平台客服,层层布局引人上钩
人物
- 全球快看:文心一言VS天工大模型,究竟谁才是国内“首个”ChatGPT?
- 世界观速讯丨罗技GPW“狗屁王”一代鼠标爆降!入手只要399元
- 梅斯健康港交所上市:市值54亿港元 腾讯与启明是股东|天天新资讯
- 华人健康:4月26日召开业绩说明会,投资者参与
- 擦亮“窗口”亮度 提升服务“热度”
- 麦卡锡首战告捷?美债务上限法案成功闯关众议院 更大考验还在后头_全球速读
- 维达国际发布一季度业绩 总收益49.69亿港元同比增长15.5%
- 夏天穿裙子优雅显气质,记住这三种穿衣技巧,时髦精致大方
- 马斯克调整推特:未登录用户无法搜索
- 哈尔滨音乐学院原创清唱剧《冰凌花——永远的赵一曼》在哈尔滨大剧院上演-世界看点
- win11eng键盘删除教程_全球焦点
- 世界热议:创业板注册制改革启动三周年:改革步履铿锵有力创新浪潮奔腾向前
- 全球今亮点!世界粮食计划署宣布暂停在苏丹的援助项目
- 奇德新材(300995.SZ)发布2022年度业绩,净利润1640万元,同比下降49.26%,拟10派1.2元_世界聚看点
- 艾布鲁:2022年度净利润约7401万元 同比增加4.77% 快资讯
- 焦点滚动:马德里网球公开赛:朱琳、王欣瑜女单未过首轮关
- 国家癌症中心张凯:结直肠癌有望成为第二个被人类“消灭”的癌症|每经人物·大健康 快播
- 明日之后怎么发红包(明日之后礼包码)_环球热点
- 世界热门:暗夜猎手2_对于暗夜猎手2简单介绍
- 英超晒榜首大战海报:瓜迪奥拉、哈兰德pk阿尔特塔、萨卡 视焦点讯
- 天天实时:石如意
- 即时:薛之谦“天外来物”官宣空降三城 星际浪漫邂逅引爆盛夏狂欢
- 加大执法力度,规范夜间施工管控
- 2023年4月26日山东省葡萄糖价格最新行情预测 全球要闻
- 外交部:大熊猫“丫丫”即将平安到家
- 有可用更新立即安装,微软增强Win11更新体验 每日关注
- 北京已建成225处“生态保育小区” 有望成为野生动物的“天堂”
- 环球观速讯丨养出好肌肤的秘密:从一瓶皇后御容臻致珍珠膏开始
- 当前速读:泸州、江津开展消费维权协作系列交流活动
- 涨停雷达:光伏个股异动 禾迈股份触及涨停 环球百事通
- 中交地产:积极开拓融资渠道,为业务发展提供资金保障
- 如何打开任务管理器 ,你最习惯用哪一种?赶快收藏 环球热头条
- pt990铂金回收价格今日多少钱一克(2023年04月26日)_天天消息
- 赠【刺绣香包】!抢疯了的寺庙“新顶流”,不必疯狂排队,现在百元就能买? 微资讯
- 通化:稻苗生长正当时 农技专家来帮忙_每日热门
- 世界时讯:食品饮料板块走弱 新乳业盘中跌停
- 天天视讯!特斯拉“破圈”争食充电桩蛋糕
- 环球报道:菱月路省妇幼保健院工地挡板暂无法拆除
- 今日讯!石昊至尊骨破碎,黄羽被击杀,柳神大秀裸足诱惑,留下救命之法
- 全球热点!七彩化学2022年营业收入12.09亿 董事长徐惠祥薪酬99.79万
- 全球播报:美海关与边境保护局警告边境移民 非法进入美国或将被遣返
- 宏达电子去年营收净利双增长 引入创业团队拓展新空间 当前动态
- 全球焦点!“节前调整”概率较大
- 杭州三批次12宗涉宅地块166.6亿元成交,8宗地块封顶摇号
- 2023年《中级社会工作法规与政策》习题解析单选题-练习题(196) 世界热门
- 巴拉圭又一总统候选人表态:支持与中国建交!
- 全球焦点!热烈欢迎!李凯尔赛季结束后飞往中国 很可能随国家队征战FIBA
- 病字头的字_病字头
- 孔宣是不是孔雀大明王_孔宣人物介绍
- 快看点丨龙虎榜|焦点科技今日涨停,机构合计净买入3635.95万元
精彩阅读
- 合肥瑶海举办“最美劳动者”摄影展 焦点
- 同飞股份2022年净利1.28亿同比增长6.56% 董事长张国山薪酬78万
- 豫章书院案4名被告公开道歉 受害学生:他们认输了却没有悔意
- 拓新药业一季度净利润同比增长970.02%_焦点热闻
- 全球热门:一季报喜人!力合科创(002243.SZ):深化改革,延续高质量成长可期
- 当前热门:一个旧信封,圆了寻亲梦!胶州警方助力,失散34年姐妹团圆!
- 全球速递!AGM G2 GT正式发布,首发500米热成像,售价5999元起
- 农业农村部发布“2023年大豆重迎茬应对技术意见”
- 夏季用电高峰将至 能源保供未雨绸缪 环球要闻
- 【世界速看料】宣威“四个强化”夯实农村劳动力信息基础
- 环球关注:我国非法集资新发案件数量连续三年下降
- 为中国消费者打造优质目的地,新加坡旅游局推进休闲旅游和MICE行业双驱动 全球观天下
- “五一”假期出行需求大幅回升 预计4月29日达到出行高峰|环球新视野
- 全球简讯:中国制造业大市佛山“转身”:“氢”车上路 融入寻常百姓生活
- 感人!新化县18名残疾人讲述人生励志故事 全球快播报
- 微头条丨日本强推“排污入海”!学界:全球海洋生态将面临核污染水风险
- 凯德中国34%资产获绿色建筑认证 当前简讯
- 汽车公司竞相布局,皮卡市场成新风口|2023上海车展_世界快讯
- 国务院安委会决定对浙江金华一厂房重大火灾事故查处实行挂牌督办
- 新数码恶魔物语二:冰界的女王 第六章 一
- 爱奇艺奇遇XR与蓝亚盒子达成战略合作
- 聚焦广交会 中国市场消费升级如何惠及全球?
- 天天简讯:移动云拟未来三年实现算网一体,年营收突破1500亿元
- 18条小红书博主运营经验、内容种草类社群SOP模板、全自媒体平台图片尺寸整理……| 一周精华 全球短讯
- 广外附属科学城实验学校:人才的培养要面向未来|高质量发展看广外力量 世界热点
- 2023四川资阳市部分国有企业引进急需紧缺专业人才拟录用人员公示
- 央行开展1700亿元逆回购操作 利率不变
- 2023年国家旅游科技示范园区评定工作启动-世界新资讯
- 卢克-肖:我真心为拉什福德和桑乔克服点球心魔而感到高兴
- 环球快报:700吨液体火箭发动机试验台考台试车圆满成功
- 【环球播资讯】创业板指跌超1% 两市超3600股下跌
- 全球今亮点!算力概念探底回升,中科曙光大涨5%,再创上市新高
- 焦点资讯:陕西一季度外送电量超160亿千瓦时 同比增长49.5%
- 聚焦广交会 中国市场消费升级如何惠及全球? 今日快讯
- 狂轰56分,黑八奇迹上演!巴特勒专打雄鹿,字母哥复出输球
- 每日观点:又?媒体到场人数不足,利雅得胜利再次取消赛后新闻发布会
- 【银河农产品0425】美玉米出口减少,美玉米继续回落!_环球新要闻
- 全球观热点:富士康深耕河南再出实招 林德工业气体项目落户郑州航空港
- 天天快播:促消费政策落地 市场销售回升前景长期看好
- 浙江宁波:全国沙滩排球大满贯赛开赛
- 如何换ip地址 ip地址如何更换-世界快看点
- 晶瑞电材(300655)盘中异动 股价振幅达7.52% 跌6.99% 报21.04元(04-25)
- 绘画决斗官网在哪下载 最新官方下载安装地址-世界时快讯
- 定胜糕典故_定胜糕寓意
- 早知道|热刺炒掉代理主帅斯特里尼
- 东方电子(000682)4月24日主力资金净卖出1793.70万元
- “降息”潮下 跨地区存款大作战
- 消费者预订“五一”期间民宿遭遇“威胁式”砍单
- 八旬老太迷失街头 警民合力助其回家
- 致远互联签约知乎 天天讯息