【TechWeb】10月31日音信,在2023云栖大会上,百川智能创举东谈主兼CEO王小川共享了百川智能在大模子时期的念念考与推行。日前,百川推出众人最长高下文窗口大模子Baichuan2-192K激发媒体蔼然。王小川先容,百川设立仅半年便发布了7款大模子,快速迭代背后离不开云盘算的援救。
2023年4月,搜狗公司原CEO王小川官宣创办AI大模子公司“百川智能”,尔后百川短短数月便踏进科技独角兽行列。尤其令东谈主瞩方针是,仅半年时刻,百川先后发布7款基础大模子,研发速率远超行业水平,且开源模子施展优异。本年8月底,百川更是率先通过国度《生成式东谈主工智能劳动解决暂行方针》备案,是首批公司中独逐一家本年设立的大模子公司。
王小川合计,大模子波涛将超过外界之前整个的遐想,时刻大爆炸正在发生,东谈主类已步入通用东谈主工智能时期。2018年,王小川便提倡,“机器掌捏谈话,通用东谈主工智能时期就来了。”他合计,谈话代表理解宇宙的鸿沟,大模子一朝掌捏了谈话的划定,就意味着掌捏了谈话背后的学问、念念考、换取和文化。在智能时期,就像互联网时期的芯片提供信息化基础相似,大模子会在社会各个方面起到“点亮智能”的作用。
但客不雅而言,国内大模子的发展与“不计资本登月”的OpenAI还存在差距。王小川暗意比特派身份,国内大模子的近况是“瞎想上慢一步,落地上快三步”。天然在时刻改动和时刻瞎想上好意思国有所当先,然而中国的讹诈落地智力更强。百川领有陶冶丰富的搜索团队,往日奏效打造过基于谈话模子的超等讹诈,且领有历程市集考据的时刻、家具、贸易化智力,团队掌捏的搜索时刻不错助力大模子研发,且能补皆大模子在幻觉等问题上的短板。
通过聚会往日陶冶和时刻集结“小步快跑”,百川现在已成为中国大模子创业公司引颈者之一。百川开源大模子总下载量3个月冲破600万次,Baichuan2在通用及垂直鸿沟均达到当先水平,中英文施展朝上LLaMA2。10月30日最新发布的Baichuan2-192K更是成为众人援救最长高下文窗口的大模子,一次可输入35万字,全面当先Claude2-100K。
除了团队、陶冶等上风外,百川甩手平均每月迭代一款模子的另一垂危原因是云盘算的撑持。王小川先容,模子的快速迭代和部署离不开云盘算,百川智能和阿里云算作简约的诱惑伙伴,在模子预考研和模子部署等方面进行了深刻诱惑。在两边的共同勤勉下,百川很好地完成了千卡大模子考研任务,有用裁减了模子推理资本,涵养了模子部署后果。
比特派无线百川的开源模子在阿里云的魔搭社区上也诱骗了广博的斥地者,借助社区的力量,斥地者们在百川大模子的基础上针对纷乱垂直鸿沟进行微调,并将其智力集成到万般AI讹诈,极大丰富了国内的大模子生态。
王小川暗意,畴昔,百川智能将与阿里云络续深刻诱惑,联袂探索更前沿的大模子时刻改动,鼓动大模子落地到更丰富的讹诈场景,共同助力大模子生态愈加蕃昌。
声明:新浪网独家稿件,未经授权拒接转载。 -->