(资料图)
7月7日下午,天壤创始人、CEO薛贵荣接受了《每日经济新闻》记者的专访。在2023世界人工智能大会上,该公司发布了一种大模型产品生态——“天壤小白”。其中包含最高1860亿参数的通用大语言模型、语义搜索引擎和开发平台。
目前,国内已是“百模混战”,天壤推出的大模型生态有何别致之处呢?薛贵荣首先向记者介绍了大模型存在的四大挑战,即大模型产生真假难辨的“幻觉”,所谓“一本正经的胡说八道”;政企私有数据的保密性要求,不能对外公开;缺少可靠的企业级中文大模型;大模型存在封闭性,无法自动更新信息。
关于天壤如何解决大模型“一本正经的胡说八道”,薛贵荣表示:“用‘提示词’去控制大模型,大模型还是会胡说八道。后来,有人尝试输入一些简单的上下文,以及对大模型进行fine-tune,但这个也不够。我们为了解决‘幻觉’问题,做了一个语义搜索引擎。先把需要的所有文档,放到语义引擎里面,比如法律书、知识库或者企业内部各种数据。该引擎使用了一个核心技术,即embedding。”
薛贵荣进一步解释:“生成式模型,最大的特点就是结果的不确定性。”那么,如何提高生成式模型的准确性呢?
薛贵荣认为:“现在给你100个字,你的答案就在这100个字里面总结。”那么是否为了提高准确性,限定生成(内容)的范围?薛贵荣回答称:“你只能用这里面的内容,做一次理解上的修饰。”
据其介绍,上述限制是放在推理端。简而言之,就是训练好大模型,为了得出一个精确值,在推理端限定一个范围。
薛贵荣介绍称,目前公司主要有三个团队,一个专门训练大模型;第二个是Fine-tune,做行业专用模型;第三个是做应用提示。
对于天壤小白大模型通过什么算力训练的?薛贵荣表示:“我们(基础)大模型的算力是租的,比如租用苏州超算(的算力),上海像商汤(的算力)我们也租。它们(商汤)有1万多张A100。另外,我们家里也有大概300张卡,以3090为主。”
(文章来源:每日经济新闻)
7月7日下午,天壤创始人、CEO薛贵荣接受了《每日经济新闻》记者的专访
保险日|广州农商银行谭波:坚守支农支小定位服务乡村振兴,谭波,广东,
7月10日早间,光伏逆变器行业上市公司德业股份(SH605117,股价元,市
格隆汇7月10日丨华胜天成600410600410SH公布近日公司收到中国证券监督
湖南法治报·新湖南客户端通讯员李发建今年入夏以来,岳阳市华容县...
榆家梁煤矿获评“5A级绿色矿山”---位于陕西省神木市店塔镇的榆家梁...
恩施上榜!住建部发布传统村落保护利用第一批可复制经验清单---湖北日
津滨发展涨停收盘,收盘价元。该股于9点32分涨停,18次打开涨停,截止
文章来源:证券之星今年以来,消费复苏不及预期成为各行各业面临的现实
插图:唐建平高原之上,夜黑如墨,我乘坐的勇士车缓慢行驶在崎岖的山路
导读1、简谱_搜谱网里面有的。本文到此分享完毕,希望对大家有所帮助。
汽车出海,新能源皮卡会成为大杀器吗?,轿车,上汽大通,汽车出海,新能源
《科创板日报》10日讯,记者从安徽省量子计算工程研究中心了解到,中国
根据晋城市城区2023年公开招聘中小学幼儿教师公告要求,现将总成绩公布
金河生物:预计在疫苗方面会有更多的融资计划金河生物近日在机构调研时
“黄牛”盯上北大清华入校参观名额,有人已被骗
7月9日,东风风神以“皓越千里瀚游星河”为主题,在官方直播间正式...
违反限行规定大曝光星期一限行尾号1和6陕U626Z1陕AA21B1星期二限行尾号
淮南市气象台2023年07月10日09时08分发布高温黄色预警信号。预计我市未
近几日,我国迎来炎热的三伏天,多地出现极端高温天气,这对于玉米的生
截至2023年7月7日收盘中光防雷300414报收于98元下跌402换手率512成交量
北向资金上周累计净流出91 60亿元,逆势增持中兴通讯11 40亿元(名单)
路透社7月9日消息,丰田在一份声明中表示,正考虑在泰国生产电动汽车。
首先在打开新手机的设置时,OPPO手机的设置菜单会醒目地提示你开启地震
根据媒体报道,苹果供应链计划在2024年第一季度开始量产iPadPro所需的O
140亿千瓦时绿电进京迎峰度夏
随着各地中小学生陆续放暑假,2023年暑期旅游市场正式开启。今年多个旅
欧洲央行管委森特诺表示,所有指标显示通胀已经达到峰值;欧洲央行的目
近日,潍坊市医保局印发通知落地实施国家组织第八批药品集采结果,7月1
人之初三字经朗读完整,人之初三字经的全文这个很多人还不知道,现在让