彩云科技发布基于DCFormer架构通用大模型云锦天章

  新闻资讯     |      2024-11-14 19:31

  早在2017年★★◆★,谷歌发布《Attention Is All You Need》论文,首次提出Transformer架构★■■,掀开了人工智能自然语言处理(NLP)领域发展的全新篇章■◆★◆◆。Transformer架构作为神经网络学习中最重要的架构,成为后来席卷全球的一系列通用大模型如ChatGPT★◆◆★■◆、Gemini的底层技术支撑。而提升Transformer的运行效率也成为人工智能领域的研究热点,2024年4月★■■★■◆,谷歌最近一次更新了Transformer架构,提出了Mixture-of-Depths(MoD)方法■■■,使得训练后采样过程中提速50%,成为Transformer架构提速升级的又一重要事件■■◆。

  中新网北京11月14日电由北京邮电大学经济管理学院与社会科学文献出版社近日联合发布的《数字经济蓝皮书 亚太经合组织数字经济治理报告》指★■◆◆.★■..[详细]

  作为国内最早做LLM(大语言模型)的公司之一,彩云科技在2017年就已经开始做NLP和大模型方面的工作★◆★■★。目前■■■★,彩云科技旗下有彩云天气、彩云小梦★■■◆★★、彩云小译三款面向C端用户的AI产品,是国内为数不多能够实现盈利的人工智能公司。

  中新网11月14日电据国家医保局微信公众号消息,为贯彻落实《深化医疗服务价格改革试点方案》,推进全国医疗服务价格项目规范编制工作,按照.◆★★■.■★◆■.[详细]

  中新网11月14日电据“上海地铁shmetro■■”微博消息★◆■★★■,自2024年4月20日起,上海地铁已在张华浜★■◆■★◆、杨树浦路、吴中路3座车站首度试点实测■◆■“闸机常★◆...[详细]

  “深度对话,超长记忆,逻辑清晰■★★★■■。◆■★”袁行远总结彩云小梦V3.5的特征★■,★■■■◆◆“我们的目标是为用户打造指尖伴侣定制梦境。”袁行远表示■★◆■■■,彩云小梦的用户单次使用时长,累计使用时长在同类产品中都处于领先的地位,“对线句,你会发现彩云小梦真正的魅力。■★■■★”

  新华财经|激活改善型住房需求 释放市场活力——财税支持房地产市场政策加速兑现

  ★◆“Scaling Law告诉我们,随着算力的提升,模型更大■■★★◆、数据更多★■,模型效果会越来越好,但与之相应的■■◆◆★◆,能耗也会越来越高,在Scaling Law失效,人工智能实现之前,或许我们地球的能源就已经无法支撑了。”袁行远表示◆★■◆◆■,“没有效率的提升◆★,AI就是镜花水月◆■★★■★。”

  中新网银川11月14日电最近★★★■◆,在许多视频网站和社交媒体上◆◆★,★★★■◆■“宁夏西吉县猎捕野猪”的直播被广泛传播,并引起了网友的围观与关注。据国家林草...[详细]

  而在应用端,拥有四百万用户的彩云小梦★■◆■★◆,也迎来了基于全新DCFormer架构的V★◆.3.5版本。与之前的版本相比■★◆,彩云小梦V3.5整体流畅性和连贯性提升了20%,支持前文长度由2000字提升至10000字,故事背景设定最长长度高达10000字。“这意味着,在故事创作或者与人工智能对话中,人工智能能够记住之前发生的事情,记住之前故事里发生的细节◆◆◆■,人物记得自己明确的目标★◆★,并且会根据剧情及时进行反思修正。在做到自主创作的同时,发散性收敛★★◆■,不会天马行空■◆◆◆,人物性格前后一致◆◆,故事逻辑性更强。★★◆”

  中新网上海11月14日电11月14日正值“联合国糖尿病日”★■■★■。“当前,临床上糖尿病◆★◆■■★、慢性肾脏病、心血管疾病相伴发生已经越来越常见,糖尿病患者..■■◆◆★.[详细]

  沟通会现场,袁行远首先向参会者展示了一个ChatGPT o1的问答■◆■★◆:“假设ChatGPT4每天响应用户约2亿个请求◆◆■■◆★,消耗超过50万千瓦时的电力■★◆■。假设全球网络都使用ChatGPT作为访问入口,ChatGPT每天消耗多少电力■◆★■◆?另外按照这个速度发展下去,到2050年全球人工智能的耗电量会达到目前地球发电能力的多少倍◆■★★?■★◆★”ChatGPT o1给出的答案是,“到2050年,全球人工智能的耗电量可能会达到目前地球发电能力的8倍”◆◆。

  中新网11月14日电2024年11月14日是第18个联合国糖尿病日★■★★■◆。据路透社报道,一项最近的研究结果显示,全球有超过8亿成年人患有糖尿病,几乎是.◆★◆★◆..[详细]

  今年的ICML会议上,彩云科技团队的3篇论文,在录用平均分为4.25-6.33的情况下,获得平均7分的高分■★★■,并成为国内唯二受邀参加维也纳ICML2024登台演讲的企业★◆◆■■■,另一家则是华为。

  11月13日★◆,彩云科技在北京总部与媒体进行一场主题为“From Paper to App”的沟通会★■★◆■。会上,彩云科技CEO袁行远★◆■■,就通用大模型未来进化之路,与人工智能的落地场景等热点话题进行了交流■■,并正式推出了首款基于DCFormer架构开发的通用大模型云锦天章■■■◆★◆,与此同时,彩云科技旗下AI RPG平台彩云小梦■■■◆,也成为首款基于DCFormer架构开发的AI产品◆◆◆◆。

  袁行远表示:我们的工作表明,Transformer架构距离“理想模型架构”还有很大的提升空间,除了堆算力堆数据的“大力出奇迹”路线■★■★,模型架构创新同样大有可为■★★■★。往小了说,在大模型领域,利用效率更高的模型架构◆★◆★■,小公司也可以在与世界顶级人工智能企业的对抗中取得优势。往大了说,模型效率的提升◆★◆■,可以有效地降低人工智能升级迭代的成本■◆◆,加速AI时代的到来■■◆。

  “世界最强的小说续写通用模型★■。★■★”沟通会上,袁行远向大家展示了首个基于DCFormer架构的通用大模型云锦天章。“这个成语是比喻文章极为高雅、华美,和我们的大模型想要实现的效果有共通之处★◆★■◆。”袁行远介绍,云锦天章可以实现在虚构世界观的基础上,赋予小说人物编程◆◆◆■★★、数学等基础能力★★◆◆,可以高速针对大量文字进行扩写★■★、缩写,针对文章风格进行大容量更换★★◆■,同时兼具其他模型的问答◆■★■★、数学、编程等基础能力★◆★★◆。

  想爆料?请登录《阳光连线》()◆★◆■◆、拨打新闻热线◆■■,或登录齐鲁网官方微博(@齐鲁网)提供新闻线索。齐鲁网广告热线,诚邀合作伙伴★★◆■★■。

  中新网贵阳11月14日电题 贵州“最美农村路◆■◆■■◆” 缩短城乡距离带动旅游产业发展中新网记者瞿宏伦■◆★■“每年虎山彝寨至琊陇坝公路沿线的红枫湖风景区...[详细]

  袁行远介绍★■★◆◆■,公司接下来将继续加大对DCFormer的研究和投入★◆■◆■:“一方面有打破‘国外做技术层,国内做应用层’刻板印象的情怀所在,一方面也是为公司自有产品应对市场竞争,实现快速迭代升级和能力领先的现实需要。”

  最高补贴600元■■★◆,12月31日截止!山东多地电动自行车以旧换新详细操作流程来了→

  习离京赴利马出席亚太经合组织第三十一次领导人非正式会议并对秘鲁进行国事访问

  栏目语21年来,54万余名大学生志愿者和西部双向奔赴★★★◆■,一句“这里需要我”,就来到祖国和人民最需要的地方■◆,在广袤的西部大地书写了为中国式★◆.■■★◆◆■.★◆.[详细]

  中新网广州11月14日电广东交通集团14日发布消息◆★◆◆★,黄茅海跨海通道项目黄茅海大桥荷载试验完成,54辆载重共1890吨的汽车分四次加载★■,最终稳稳...[详细]

  来自秘鲁的安东尼奥在北京生活了十多年■◆◆,北京的传统气韵和现代活力都让安东尼着迷,他喜欢在胡同里漫步★★■,感受传统与现代交织的气息;也爱骑...[详细]

  彩云科技团队构建DCFormer框架,提出可动态组合的多头注意力(DCMHA),替换Transformer核心组件多头注意力模块(MHA),解除了MHA注意力头的查找选择回路和变换回路的固定绑定★■■★◆,让它们可以根据输入动态组合◆◆,从根本上提升了模型的表达能力,由此实现了对Transformer架构1.7—2倍的性能提升。

  新华社北京11月14日电财政部■★◆◆★、税务总局、住房城乡建设部13日发布公告,明确多项促进房地产市场平稳健康发展的相关税收政策■◆◆★★■。具体来看◆★■★■◆,包括...[详细]