药融会| 三泰科技王柯:从分离纯化的视角思考化学领域智能化
相约药融圈
各位药粉:
大家好!
每周晚8:30 药融圈的药化创业者群、销售采购群和工艺放大群都会邀请不同创新创业者或者技术大牛举行线上专享会,通过不同领域不同方向不同职能的人才分享给人以深刻的思想启迪,从而达到改变企业负责人经营思维的目的。思路决定出路,一个企业的发展战略布局,企业负责人的思维起到了关键性作用!
药融圈第110场专享会嘉宾:三泰科技总经理 王柯
三泰科技总经理
王 柯
三泰科技(常州)有限公司成立于2004年,是一家致力于开发和应用分离纯化技术的高科技企业。公司的产品和服务主要应用于生物医药、天然产物、精细化工和石油产品等领域。主要产品有快速液相制备色谱柱(Flash Chromatography Column)和快速液相制备色谱系统(Flash Chromatography System),以及基于硅胶基质而开发的用于分离和纯化的填料系列产品。
今天的分享更多的是结合自己的背景谈一些想法,一些思考。分享内容主要集中在实验室研发领域,最后会提及选择分离纯化。尤其是制备色谱分离作为切入点谈化学领域的智能化,分离纯化无论是分析还是制备都有自动化程度较高的仪器设备在实验室普遍使用。当然更重要的是,我自己的工作就是做分离纯化,体会更深一些。简单介绍下我的背景:本科学的是应用化学,研究生在国外学了两年的有机合成后转学计算机信息系统。所以化学和计算机都略知一二,2003年初回国,2004年创立常州三泰科技有限公司。主要生产一次性的快速液相色谱制备分离柱(flash column),12年开发具有“互联网+”功能的中低压快速制备液相色谱仪(flash chromatography system)SepaBean machine。其中2009年创立了Santai Labs(常州协丰医药研发有限公司)一家微型CRO公司,目前20多人的规模,主要做定制合成和目录化合物。讲一讲化学领域中关于化学信息,数据的现状和问题,当然我还讲到其中的解决方案,以及结合当前的热门AI和区块链技术进行一下应用方面的探讨和思考。
▼
从分离纯化的视角
思考化学领域智能化
研究化合物离不开分离纯化,不管是通过合成手段还是天然产物的提取。每一次分离纯化都会产生至少一条分离纯化数据,世界各地的合成实验室每天都在产生海量的分离纯化数据(同样海量的还有合成数据等)这些数据。有的以文件的格式存储在一台一台的制备色谱仪器的硬盘中,有的记录在各种纸质的实验记录本或者电子实验记录本中,但更常见的是存储在各位研究员的“肚子”里。这里有一个矛盾,因为合成化合物的主要目的是得到一定纯度的目标化合物用于下一步的研究,至于怎么分离纯化甚至于怎么合成,很多时候倒是被忽视的。因此分离纯化数据、合成工艺数据,在整个研发活动中更像是“副产物”,如若鸡肋,食之无味,弃之可惜。没有好的数据积累基础,智能化就是空谈了。一方面,我们明知这些数据有用,需要整理和保存下来。但另一方面,因为这些数据不能产生直接的效益,整理和保存却需要额外的资源投入,所以即使当时记录了这些数据,往往就束之高阁了。虽然说实验记录基本都电子化,但这些实验记录本中的化学数据从计算机角度来看,还是孤立不可搜索的,从而其价值也是有限的。我们记录的是一个化合物的合成和分离工艺,这些数据是合并在一起的,缺少可分割的灵活性。也就是说从电脑角度,很多数据没法用,拉长一下时间轴,这些数据除去可以用来发论文或专利的数据,看不到直接的价值或效益。不可搜索也没有用合适的方式来关联和处理这些数据,因此这些海量的数据每天都在“消失”。AI也需要数据来训练和学习,高校和科研院所的课题组,以及无论是大公司还是小公司的研发实验室,每天投入的研发资源中,相当比例的产出因为是“副产物”而被浪费掉了。这种浪费,是因为这些化学数据没有用合适的方法或技术手段来关联和处理。这些数据没有价值,因为不可搜索。
进入下一主题前先来两个问题:1、为什么化学合成至今更像是一门“手艺活”,讲究经验和技巧、诀窍甚至是秘方;2、为什么化学合成还是人力密集行业,尤其考虑到需要整天与有毒溶剂易燃易爆危险化学品打交道,并且还需要多年的理论培训,是不是非博士、硕士和本科不可?带着这些个问号,我们进入下一主题。如何让这些看似鸡肋的化学数据变的有价值呢?大家知道,任何数据只有按照一定的规则记录才能体现价值。而且从电脑的角度,数据记录越是原子化就越有操作组合的空间。下面来看一下,如果我们制定一个规则来记录分离纯化数据,会发生什么。
规则二是对规则一中的样品化合物的信息的补充。如果一个化合物有三条不同路线来合成,那么就有三种不同的样品化合物体系。因为不同的合成路线会带来不同的杂质,样品化合物体系可以根据原料化合物与目标化合物的信息生成唯一的身份标识号码。计算机中每一个化合物都可以用唯一的字符串来标识。这种包含原料信息的样品化合物体系或者目标化合物体系的重要性怎么强调都不为过。比如医药领域,根据规则二记录的样品化合物的信息是可以唯一表征一个样品化合物体系的特征信息。这个规则二的意义非常大,可以唯一标记的样品化合物体系信息关联分离纯化的工艺数据,就是一个有价值可以交易的数据块。可以唯一标记的样品化合物体系信息自动包含目标化合物的一步的合成路线信息(单元反应),就是一个有潜在价值可以交易的数据块。这个规则还可以进一步细化记录分离纯化工艺的要素。规则明确后,数据的积累就变得有意义和价值。自动化甚至智能化也成为可能,比如机器就可以根据上述规则存储的分离纯化数据自动执行一个分离纯化任务,还可以通过机器学习根据上述规则自动生成分离纯化数据。根据这个规则记录分离纯化数据后,我们还可以得到这些信息这条记录的所有者,可以合成这个化合物。化合物一步的合成路线有了,完善一下工艺数据就可以了。根据这些信息进行技术处理,一个有交易价值的系统已经出现在前方了。剩下的问题是:怎么让从事化学行业的人愿意根据这个规则来记录这些个数据呢?下面和我一起再看几个问题,为下一个探讨对象做铺垫。
技术大牛可以完成复杂的全合成,也可以巧妙地缩短合成路线,高超地提高产物的效率,还可以根据经验和技巧干净利落地以最低的成本完成一个分离纯化,但是,化学真的就是要依靠技术大牛吗?
从事化学行业的人设计了合成路线,最后要合成那个化合物的时候,还是得我们自己冒着各种危险去操作吗?
从事化学行业的人时候才能摘掉“手艺人”、“化学民工”这些个帽子和标签呢?
人工智能和区块链技术离从事化学行业的人有多远?
人工智能与合成,人工智能与分离纯化。尤其在大公司,因为有相当大的数据积累,很自然地就要往人工智能这个方向走。现在已经有从事化学行业的人可以设计合成路线了,这是人工智能在化学领域最现实的应用了。随着更多数据的训练,相信这个合成路线的设计会越来越合理和可行。但是要做到进一步的优化工艺,或者找到最短、最有效的合成路线,我相信还有很长的路要走。作为一个从事化学行业的人,实在体会太深了。大吉想想自己的实验室,有多少失败的反应数据藏起来或丢掉了或烂在研究员的肚子里了?有多少反应中间体扔在柜子下面无人问津?大家有机会去看看那些世界级的制药公司的“地下库房”,可能有上百万的中间体就静静地躺在那里无人问津也无人敢问津。假如我们生活在理想国,所有做过的反应,所有的中间体的数据都触手可及,那么现在通过scifinder或reaxys或化学行业设计的需要十步路线合成的化合物,可能只需要一步或两步就可以合成出来了。因为在理想国,逆合成往前推一步或两步你发现在某个实验室就有这个中间体而且人家愿意提供给你。不过这些在我们现实的化学世界里,还是不能做到。你为了合成一个目标化合物,查文献守反应甚至绞尽脑汁打通一个一个反应路线的时候,上帝却看到一个个中间体化合物就躺在这里那里和某处,为你着急跺脚,这是多么大的资源浪费啊!这是我们做化学的大问题啊,我们做不到,因为一个新物质结构我们要保密,合成前体要保密,合成工艺要保密,分离工艺要保密,技术诀窍要保密,经验要保密(所以很多经验不能转换为数据保存下来),甚至环保工艺也不能告诉你!因为我们之间缺少信任,当然各种法律法规、合同约定,就是我们人类社会为建立信任关系的努力和成果。区块链技术建立可编程社会,把法律合同合约编入程序,目的是建立一个可靠的信任关系。目前人工智能在化学领域,尤其是生物医药领域,包括医疗领域的应用会越来越多。凡是有特征信息的数据,可搜索的数据,这些数据全而多就会有人工智能的快速发展,我们就能通过机器学习等技术来学习这些数据从而实现智能化。智能化到人工智能,是需要数据作为基础来支撑的,没有可靠的数据,什么都是保密的话AI会很慢很慢。
我在读研究生时候学过分布式计算系统(distributed computing system),并且做过一个应用分布式技术的小项目。这段经历让分布式的思想深入脑髓,因此在我们自己的产品设计中,很自然地融入了分布式、网络同步、节点更新和加密等理念。一直以来认为比特币是骗子类的东西,所以心底里一直很排斥,直到区块链的概念和字眼一直在眼前晃,躲也躲不开,就硬逼着自己啃区块链技术的书。不过比特币对区块链技术的普及功不可没,区块链本质上是一种分布式计算系统,我们来看区块链技术怎么应用到化学世界。
化学者:区块链技术如何应用到化学领域,从哪里入手?
化学区块链:我本质上是一种加密的分布式记账数据库,先从你们的化学数据入手,我来帮你保管这些数据。
化学者:什么数据?能给我举例详细说明吗?
化学区块链:假设这个区块链应用系统(缩写“CBC”)已经建设好了,你买了一台SepaBean machine(缩写“SBM”,一台挖矿机,一个节点,一名光荣的矿工),并用用这台机器完成了一个样品化合物的分离纯化,根据前面的数据记录规则,这台机器会生成若干个数据块(区块),其中一个是这个样品的分离纯化工艺,还有一个是这个样品化合物的一步的合成路线。另外你还表示愿意卖这个样品化合物,如果有人要买的话,恰好这台SBM是矿工,SBM把上面这些信息写入CBC,记好帐,还得了100个化学币的奖励。这里的“记账”所记录的信息不需要完整的工艺数据,记录可以公开的特征关键信息。因为有奖励,越来越多的SBM参与进来作为节点,参与挖矿经过一段时间的运行,CBC已经有相当数量的数据了。
化学者:有了足够多的数据和信息,可以交易了吧?
化学区块链:是的,前面提到的问题,包括信息不对称的问题,在CBC就可以很好地解决,通过运行合适的脚本,CBC甚至可以自动匹配买卖双方完成公开透明的交易。
总而言之,通过CBC,化学者可以通过加密的、匿名的交易,各取所需。还有一个非常重要的点,就是CBC强调的是一步的合成路线和工艺,也就是单元反应,那么通过CBC技术,我们完全有可能发展出高效,甚至是接近100%转化率的单元反应工艺。CBC就是区块链技术,化学方面的信息和数据只是记账而已,合成细节不公开,都是加密的。公钥和私钥,只有买你工艺的人才能看到细节。区块链技术的意义很大,颠覆性的底层技术框架,区块链技术(以“CBC”为例)为化学人提供了n种想象空间和发展可能。
CBC是分布式安全加密的,你的核心数据可以继续存储在自己的私有域甚至私有链中。所需要公开的只是你的产品、服务、信息的关键特征信息即可。分布式的意思就是没有中心服务器,你的数据还是你的数据。比特币只是区块链技术的一个应用,公钥私钥、智能合约,都是写入程序的。虚假节点有成熟的技术方案,区块链技术是开源的,成熟的技术。CBC是开放的、去中心化的,每个化学者都可以为CBC添砖加瓦,并获得收益。不管是通过交易的方式,还是“记账”的方式,CBC为协同分工和公平交易提供了技术保障。
可编程社会,就是把规矩合同都写入程序谁都篡改不了,系统自动执行。CBC为新型的创业方式提供了可能:化学者可以在自己擅长的领域发挥自己的专长,为需要的人提供产品、服务和信息,提高效率,降低成本。结合CBC,创业公司可以开发出成熟稳定高效的单元反应工艺+并联的n个微反应器+flow chemistry,从而完全有可能替代目前化工生产的反应釜技术,从而为化学品生产提供一种安全可控的绿色化学生产工艺。一项新技术的出现,要么理解接受,要么做旁观者,这是很正常的现象。区块链就不需要统一行为规范,区块链是技术,不是社区,区块链就是自发的。
欢迎关注药融圈官网
看这里:www.pharnex.com
点击文末 阅读原文 可直接进入
加入药融圈可享受的服务有:
夜听专题分享:实战企业家亲身分享创业经验
获取优质人脉:结识顶级技术大牛及创业者
信息获取:实时在线解决行业难题
解决金融需求:供应链金融和股权投融资
优质商机获取:项目合作及企业投融资需求发布
参加高端活动:不定期举办线下活动,考察团及盛大年会
药融圈基金:优先被投资,孵化上市企业