查看原文
其他

性能超Llama2-13B,华为哈勃、北京国资基金刚投,吴恩达点赞

抱一君 元界
2024-09-05

元界由《权力、资本与商帮》作者王俞现 主理。元投会现已聚集38+投资机构,左下角阅读原文加入。



首次!中国元宇宙区县、产业园、乡镇、街区TOP榜评选,上路

中国科技新突破!38岁,喜欢莫奈,灵感源于光子,受周易启发



朱啸虎的天花板已然形成,但中国面向大模型和人工智能产业的天花板,正在创投新标杆及产业大佬的笃定中,走上打破之路。


他们正在不动声色地加码、押注中国大模型、芯片等卡脖子领域产业和企业,这是与市场派迥然不同的气象,中国需要这样的气象蔚然成风。



创投资本与产业资本交相辉映

北京市人工智能产业投资基金成风向标


4月11日,面壁智能完成新一轮数亿元融资,由春华创投、华为哈勃领投,北京市人工智能产业投资基金等跟投,知乎作为战略股东持续跟投支持,光源资本担任独家财务顾问。


从成立之初,春华创投持续关注人工智能领域,希望陪伴富有远见的创业者,通过支持技术变革,解决人类面临的难题。


此次融资值得细细梳理,这是华为哈勃继去年8月参与独角兽企业深势科技超7亿元股权融资之后,又一次出手投资大模型企业。而3月底,华为哈勃刚与红杉、高瓴等投资了一家3D引擎公司。红杉、高瓴后,华为哈勃投下这家元宇宙领域公司,3D引擎迎风口?


这也是北京市人工智能产业投资基金,继3月被曝首投国内大模型领军企业智谱AI之后,又一次投资大模型公司,而一天后,其再投打造通用人工智能安全基座的瑞莱智慧。


百亿估值大模型公司再获融资,国资背景基金出手,三大看点

清华系,院士背书,AI安全底座,国资人工智能基金再次出手


北京市人工智能产业投资基金,由北京市科委、中关村科技园区管理委员会、北京市政府引导基金联合设立,目标总规模为100亿元人民币,其中北京市政府投资引导基金(引导基金)出资不超过30亿元。基金可以分两期实施,首期目标规模为40亿元。


北京市人工智能产业投资基金,正在成为中国大模型领域投资的风向标,而其首先瞄准的是中国大模型领域的清华系。


不仅如此,中国产业资本也在不断入局,这是一个醒目的现象。


2月,国内AI创业公司北京月之暗面完成新一轮超 10 亿美金融资,这是自ChatGPT 掀起全球浪潮以来,国内 AI 大模型公司迄今获得的单轮最大金额融资。阿里携手红杉中国等,领投。从估值3亿美元到融资超10亿美元,他仅用8个月|中国未来产业100人


在领投的公司中,除阿里外,还有小红书、美团。


在对面壁智能的投资中,除华为哈勃外,知乎作为战略股东持续跟投,也是这种现象的持续。


相较之前,春节过后,中国资本对中国卡脖子领域的投资是紧密的,甚至有目不暇接之感。


除大模型外,在AI算法领域,4月9日,墨芯人工智能科技(深圳)有限公司发生工商变更,蚂蚁集团领投,盛景嘉成跟投,完成数亿元B轮投资。41岁AI芯片大牛,连融两轮数亿元,又见蚂蚁集团领投


4月12日,清华大学电子工程系对外发布一则重大科技新闻:中国AI光芯片获得新突破!这是打破算力瓶颈中国探索的AI算法新路径。中国科技新突破!38岁,喜欢莫奈,灵感源于光子,受周易启发 这一重大成果想必也将吸引资本涌入。



清华系,世界级创新突破不断

打通大模型产业落地的最后一公里


面壁智能,成立于2022年8月,总部在北京,是国内最早开始探索大模型和AGI的团队之一。去年4月,面壁智能完成数千万元天使轮融资,知乎领投,智谱AI跟投。


面壁智能的核心研发团队,脱胎于清华NLP实验室,拥有中国首批大模型研发精锐力量,还有来自阿里、字节、百度等的人才。


在公司成立的初始阶段,面壁即开始Agent研究探索,并不断在底层技术上取得世界级创新突破。


从 2013年进入深度学习领域,2018年确定 Bert 技术路线,2020年成为国内首个尝试大模型路线并坚定投入的团队,2023年初开展对 AI 智能体(Agent)的超前探索、年中发布千亿多模态大模型、年末开始大模型端云协同的前瞻布局——在激烈竞争的计算机领域,面壁对于自己超前的 AI 技术研判策略,坚持超人的验证耐心并逐渐收获大众的认知与认同,其中部分研判的创新领先性甚至提前于发展现状一年之久。


2023年发布的大模型驱动下的 Al Agent “三驾马车”,全面覆盖单体智能、群体智能和智能体应用框架领域。


AI 智能体是大模型落地应用的最后一公里。面壁智能以“智周万物”为愿景,致力于创造安全、普惠的通用人工智能,推动大模型技术落地千行百业。



”大模型+Agent“是AI发展破局之道

技术路线获吴恩达点赞


面壁智能的“大模型+Agent”技术路线也在今年得到斯坦福大学教授、知名人工智能学者吴恩达的认同,来自面壁的明星开源项目 ChatDev 多智能体协作工作,亦得到赞赏。


近日,他在一次演讲中表示:“基于 GPT-3.5 构建的智能体工作流在应用中表现比 GPT-4 要好。AI 智能体工作流将在今年推动人工智能取得巨大进步,甚至可能超过下一代基础模型,这是一个值得所有人关注的趋势。”

其中,吴恩达教授点赞了来自面壁智能的 ChatDev 项目,为大家详细阐述了“多智能体协作”的趣味和魅力所在——开一家游戏公司只需要一个 ChatDev 就够了:当给到不同的 prompt 时,ChatDev 可以分饰多个AI智能体,分别扮演软件公司的 CEO、产品经理、设计师、测试人员......

该工作由面壁智能、OpenBMB 及清华大学NLP实验室共同开源。面壁智能以”大模型+Agent“双引擎战略驱动,拥有国际领先的 AI Agent 技术,目前已推出个体智能、群体智能和智能协作的 AI Agent“三驾马车”,并已经携手众多合作伙伴,打造了一系列”大模型+Agent“赋能行业发展的标杆案例,应用于智能营销、法律等场景中。

在高效推理方面,面壁率先以“衔尾蛇投机采样”为代表的协同推理技术,在云侧建立起大小模型之间的协同,极大提升云侧大模型的服务速度。与面壁端侧模型相结合,有望通过端云协同推理来进一步降低大模型使用成本。


目前面壁智能已完成了贯彻高效训练、高效落地与高效推理的大模型全栈技术生产线布局,与招商银行、数科网维、知乎等合作伙伴一同将大模型与Agent技术部署落地于金融、教育、政务、智能终端等应用场景。



四连发

基座模型性能超越 Llama2-13B


4月13日,作为全球领先的旗舰端侧模型系列,面壁 MiniCPM迫不急待地上新,一口气带来四大提升:


端侧最强的多模态模型 MiniCPM-V 2.0:OCR 能力显著增强,甚至部分能力比肩 Gemini Pro;


适配更多端侧场景的基座模型 MiniCPM-1.2B:性能超越 Llama2-13B,推理速度达到人类语速近 25 倍;


最小的 128K 长文本模型 MiniCPM-2B-128K ;


性能进一步增强的 MoE 架构模型 MiniCPM-MoE-8x2B。


其中,MiniCPM-1.2B,参数减少一半,速度提升 38%,成本下降 60%(1元= 4150000 tokens)。在手机上的推理速度达到 25 token / s,甚至相当于人的语速的15-25倍。‍‍‍‍


在公开测评榜单上,MiniCPM-1.2B 延续以小博大、越级超越的传统,取得了综合性能超过 Qwen1.8B、Llama2-7B 甚至超过 Llama2-13B 的优异成绩。




引领高效大模型路线,面壁招人啦


面壁智能称,其走的是高效大模型路线,就是把大模型变得更小,更强,推动大模型落地应用!


本轮融资完成后,面壁智能称,将进一步推进优秀人才引入,加固大模型发展的底层算力与数据基础,持续引领高效大模型路线,推动大模型高效训练、快步应用落地。


抱一君在智联招聘看到,面壁智能面向2024届毕业生(2023年11月-2024年8月期间毕业)校招的大模型算法工程师,方向为预训练方向、大数据方向、创新方向、多模态方向,月薪3-6万,14薪。


此外,还有多模态算法工程师(数据方向)、NLP算法工程师、算法工程师(AI Agent)等方向的待招岗位。


资料来源:面壁科技

编      辑:抱一君

商务合作:imerit(微信)


推荐阅读

什么是新质生产力,如何指导新的发展实践,总书记作了详细阐释

工信部部长:人工智能为数字化转型关键变量,要促进元宇宙形成新质生产力

广东省委书记黄坤明:发展新质生产力是竞速赛、耐力赛、接力赛

杭州市委书记刘捷:以人工智能+为首要任务开启“黄金二十年”

以新质生产力为牵引,陕西盘家底,确立首批10个千亿产业集群

朱啸虎的天花板,不应成为中国的天花板 


继续滑动看下一个
元界
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存