性能超Llama2-13B,华为哈勃、北京国资基金刚投,吴恩达点赞
也
元界由《权力、资本与商帮》作者王俞现 主理。元投会现已聚集38+投资机构,左下角阅读原文加入。
朱啸虎的天花板已然形成,但中国面向大模型和人工智能产业的天花板,正在创投新标杆及产业大佬的笃定中,走上打破之路。
他们正在不动声色地加码、押注中国大模型、芯片等卡脖子领域产业和企业,这是与市场派迥然不同的气象,中国需要这样的气象蔚然成风。
创投资本与产业资本交相辉映
北京市人工智能产业投资基金成风向标
4月11日,面壁智能完成新一轮数亿元融资,由春华创投、华为哈勃领投,北京市人工智能产业投资基金等跟投,知乎作为战略股东持续跟投支持,光源资本担任独家财务顾问。
从成立之初,春华创投持续关注人工智能领域,希望陪伴富有远见的创业者,通过支持技术变革,解决人类面临的难题。
此次融资值得细细梳理,这是华为哈勃继去年8月参与独角兽企业深势科技超7亿元股权融资之后,又一次出手投资大模型企业。而3月底,华为哈勃刚与红杉、高瓴等投资了一家3D引擎公司。红杉、高瓴后,华为哈勃投下这家元宇宙领域公司,3D引擎迎风口?
这也是北京市人工智能产业投资基金,继3月被曝首投国内大模型领军企业智谱AI之后,又一次投资大模型公司,而一天后,其再投打造通用人工智能安全基座的瑞莱智慧。
北京市人工智能产业投资基金,由北京市科委、中关村科技园区管理委员会、北京市政府引导基金联合设立,目标总规模为100亿元人民币,其中北京市政府投资引导基金(引导基金)出资不超过30亿元。基金可以分两期实施,首期目标规模为40亿元。
北京市人工智能产业投资基金,正在成为中国大模型领域投资的风向标,而其首先瞄准的是中国大模型领域的清华系。
不仅如此,中国产业资本也在不断入局,这是一个醒目的现象。
2月,国内AI创业公司北京月之暗面完成新一轮超 10 亿美金融资,这是自ChatGPT 掀起全球浪潮以来,国内 AI 大模型公司迄今获得的单轮最大金额融资。阿里携手红杉中国等,领投。从估值3亿美元到融资超10亿美元,他仅用8个月|中国未来产业100人
在领投的公司中,除阿里外,还有小红书、美团。
在对面壁智能的投资中,除华为哈勃外,知乎作为战略股东持续跟投,也是这种现象的持续。
相较之前,春节过后,中国资本对中国卡脖子领域的投资是紧密的,甚至有目不暇接之感。
除大模型外,在AI算法领域,4月9日,墨芯人工智能科技(深圳)有限公司发生工商变更,蚂蚁集团领投,盛景嘉成跟投,完成数亿元B轮投资。41岁AI芯片大牛,连融两轮数亿元,又见蚂蚁集团领投
4月12日,清华大学电子工程系对外发布一则重大科技新闻:中国AI光芯片获得新突破!这是打破算力瓶颈中国探索的AI算法新路径。中国科技新突破!38岁,喜欢莫奈,灵感源于光子,受周易启发 这一重大成果想必也将吸引资本涌入。
清华系,世界级创新突破不断
打通大模型产业落地的最后一公里
面壁智能,成立于2022年8月,总部在北京,是国内最早开始探索大模型和AGI的团队之一。去年4月,面壁智能完成数千万元天使轮融资,知乎领投,智谱AI跟投。
面壁智能的核心研发团队,脱胎于清华NLP实验室,拥有中国首批大模型研发精锐力量,还有来自阿里、字节、百度等的人才。
在公司成立的初始阶段,面壁即开始Agent研究探索,并不断在底层技术上取得世界级创新突破。
从 2013年进入深度学习领域,2018年确定 Bert 技术路线,2020年成为国内首个尝试大模型路线并坚定投入的团队,2023年初开展对 AI 智能体(Agent)的超前探索、年中发布千亿多模态大模型、年末开始大模型端云协同的前瞻布局——在激烈竞争的计算机领域,面壁对于自己超前的 AI 技术研判策略,坚持超人的验证耐心并逐渐收获大众的认知与认同,其中部分研判的创新领先性甚至提前于发展现状一年之久。
2023年发布的大模型驱动下的 Al Agent “三驾马车”,全面覆盖单体智能、群体智能和智能体应用框架领域。
AI 智能体是大模型落地应用的最后一公里。面壁智能以“智周万物”为愿景,致力于创造安全、普惠的通用人工智能,推动大模型技术落地千行百业。
”大模型+Agent“是AI发展破局之道
技术路线获吴恩达点赞
面壁智能的“大模型+Agent”技术路线也在今年得到斯坦福大学教授、知名人工智能学者吴恩达的认同,来自面壁的明星开源项目 ChatDev 多智能体协作工作,亦得到赞赏。
在高效推理方面,面壁率先以“衔尾蛇投机采样”为代表的协同推理技术,在云侧建立起大小模型之间的协同,极大提升云侧大模型的服务速度。与面壁端侧模型相结合,有望通过端云协同推理来进一步降低大模型使用成本。
目前面壁智能已完成了贯彻高效训练、高效落地与高效推理的大模型全栈技术生产线布局,与招商银行、数科网维、知乎等合作伙伴一同将大模型与Agent技术部署落地于金融、教育、政务、智能终端等应用场景。
四连发
基座模型性能超越 Llama2-13B
4月13日,作为全球领先的旗舰端侧模型系列,面壁 MiniCPM迫不急待地上新,一口气带来四大提升:
端侧最强的多模态模型 MiniCPM-V 2.0:OCR 能力显著增强,甚至部分能力比肩 Gemini Pro;
适配更多端侧场景的基座模型 MiniCPM-1.2B:性能超越 Llama2-13B,推理速度达到人类语速近 25 倍;
最小的 128K 长文本模型 MiniCPM-2B-128K ;
性能进一步增强的 MoE 架构模型 MiniCPM-MoE-8x2B。
其中,MiniCPM-1.2B,参数减少一半,速度提升 38%,成本下降 60%(1元= 4150000 tokens)。在手机上的推理速度达到 25 token / s,甚至相当于人的语速的15-25倍。
在公开测评榜单上,MiniCPM-1.2B 延续以小博大、越级超越的传统,取得了综合性能超过 Qwen1.8B、Llama2-7B 甚至超过 Llama2-13B 的优异成绩。
引领高效大模型路线,面壁招人啦
面壁智能称,其走的是高效大模型路线,就是把大模型变得更小,更强,推动大模型落地应用!
本轮融资完成后,面壁智能称,将进一步推进优秀人才引入,加固大模型发展的底层算力与数据基础,持续引领高效大模型路线,推动大模型高效训练、快步应用落地。
抱一君在智联招聘看到,面壁智能面向2024届毕业生(2023年11月-2024年8月期间毕业)校招的大模型算法工程师,方向为预训练方向、大数据方向、创新方向、多模态方向,月薪3-6万,14薪。
此外,还有多模态算法工程师(数据方向)、NLP算法工程师、算法工程师(AI Agent)等方向的待招岗位。
资料来源:面壁科技
编 辑:抱一君
商务合作:imerit(微信)
推荐阅读
工信部部长:人工智能为数字化转型关键变量,要促进元宇宙形成新质生产力