查看原文
其他

这家法律大数据公司,正致力于解放全行业的生产力

2017-10-10 林戈 智合法律新媒体

采访&撰稿 / 林戈

来源 / 智合法律新媒体


“达特茅斯之夏”,这个对于法律人来说略显陌生的词组,在人工智能界代表着求索的缘起。1956年夏季在达特茅斯的这场人工智能研讨会,揭开了漫长探索的序幕。

六十年后的北京,一群法律人和技术人聚在一起,决定用这个词组给他们的会议室命名。这么做,是为了提醒团队里每一个成员,人工智能其实并不是一个新鲜词汇,它经过了几十年的兴衰起伏寒暑交替,品尝过长年枯坐不见进展的冷遇,也经历过聚光灯下人人趋之若鹜的热潮。这群人想做的,不是炮制概念,不是挥洒泡沫,而是踏踏实实在法律领域的人工智能这条道路上探索下去,做出真正的突破。

从2016年夏天到2017年秋天,一年时间里,他们低调地完成了法院、检察院、律师市场的行业产品布局。这间公司,叫做华宇元典。

01


  0725:  元 典 的 原 点







踏入元典办公场所,进门右手边第一间会议室,名字就叫做“0725”,这是元典在2016年的诞生之日,从0到1的原点。

元典的母公司华宇软件起初邀请前检察官邹劭坤担任即将成立的元典的CEO时,邹劭坤其实是心怀踌躇的。他深知法律领域的人工智能前景辉煌,但却是一条漫漫长路,行路者需要实力,也需要诚意。邹劭坤彼时已从检察院离职,主业律师和副业私募基金都进行得顺风顺水,在这样的新领域里担任初创公司CEO,意味着未来可见的数年里,时间与头脑都要被这条征途满满占据。

邹劭坤很清楚这不是一场百米赛跑,而是蜿蜒曲折的漫长赛道。他在心里列出了考察清单:即将成立的元典是想趁势捞一波热钱,还是真的想要做出质变突破?如果是想要玩点大的,华宇软件的积累和决心,能不能支撑元典挺过研发、布局的暗夜,迎来突破的黎明?

他先深入了解了华宇软件。

作为电子政务和行业解决方案提供商,上市公司华宇软件在法律领域深耕已十六年,根据IDC中国电子政务研究报告,华宇软件自2006年至今连续十年位列中国电子政务IT解决方案供应商十强,在法院、检察院信息化建设领域连续多年市场占有率第一,是最高人民法院、最高人民检察院等等客户的长期合作伙伴,在技术、产品、数据和行业认知上都具备深度积累。

之所以创立元典,则是要聚集优秀的法律人和技术人,在法律智能领域构建一幅蓝图:“让机器逐渐习得法律认知能力,在数据孤岛间搭建连接的道路”。

熟悉法律行业的人都知道,目前中国法院、检察院、律师的案件承办量、法学研究者的成果正在逐年攀升。最直观的反映是,法律行业的数据积累正在呈现爆发式增长,而且法律服务市场也已达到了千亿的量级,这是行业快速发展的表现。

但从另一方面来看,法律人的工作处处耗费大量的人力和心力。由于法律行业的高度专业性,从业门槛较高,法官、检察官、律师的工作强度在不断加大,行业资源、司法资源尚未有效整合。华宇软件判断,智能工具,将成为这个时代的破局之钥。

邹劭坤和华宇软件达成了共识:“元典要做的,是融合法律与科技,以大数据和人工智能来解放法律行业的生产力。人工智能会不断经历能力的进阶,希望无论在哪个阶段,元典都能够通过开发法律实务智能产品,成为法律行业的引擎公司,为法律行业提供智能服务。”


02


随机森林: 当技术、法律、数据风云际会 







得知华宇软件派出了李东海和张斌琦加入元典后,邹劭坤下定决心开启他的元典之旅。

元典的副总经理李东海,此前一直在华宇软件任职,已有十余年大数据挖掘、自然语言处理相关技术研发工作经验。谈到智能的发展史,他说:“大数据和机器学习的发展可以分为三个阶段。第一个阶段称为‘计算智能’,即快速计算和记忆存储能力,主要针对结构化的数据进行统计、决策、回归及预测。第二个阶段称为‘感知智能’,即视觉、听觉、触觉等感知能力,例如OCR、图像转化、语音识别技术等就是最为典型的代表。第三个阶段称为‘认知智能’,即机器能够理解、认识、思考事物的本质。而我们现在,已经逐渐跨入认知智能时代。”

加入元典,李东海丝毫没有犹豫。在机器的法律认知领域钻研多年,每有新的技术方向,他都带着团队迅速尝试。但在法律这个垂直领域里,有太多专业的知识和经验,非单纯靠技术的暴力突破所能征服。能跟一群法律人一道去攻克这个坚固无比的堡垒,对于技术人员而言,是一项令人兴奋的挑战。

这一年里,在法律人和技术人共同努力下诞生的元典睿核,是元典所有产品的根基。以法律知识图谱为底层谱系,元典睿核致力于不断提高机器对于法律概念的认知能力,并且将这种能力输出到外显的产品上,在具体的场景之中为法律人提供智能辅助。

李东海坦言,在研发过程中,法律行业的高度专业性确实让他产生过不少困扰。但好在,元典的法律研究院有一群具有丰富实务经验的法律研究员和出色的法学院毕业生,他们与技术人员紧密合作,将他们的知识和经验转化为机器学习的养料。

元典人用“随机森林”命名了一间会议室,这是一种机器学习领域的算法,一篇解释“随机森林”原理的文章说,恰如多个人组成的攻关团队,每个人都需要有其他人不具备的能力,如果大家都是相同的能力模型,在解决难题上并没有帮助。假设对一个数据的预测,大家的结论都是1,最后组合结论依然是1,没有任何改变。随机森林就是让每棵树不一样,组合后提升效果,这是这类算法的精髓。

这种算法,正是元典所秉持的精神,将具备不同知识、经验、能力的人组合在一起,让他们融合后的智慧,淬炼成机器的智能。

03


忒修斯之船:要驶往法律人的明天,这是必乘之帆 







现在的元典法律研究院人才荟萃,他们中的前检察官们有的是全国十佳公诉人,有的是从业经历超过二十年的“北京市检察业务专家”,担任民商事研究员的前法官们拥有平均十年以上的审判经验。在团队起步之初,在邹劭坤之外,第一个加入这支元典法律团队的是黄琳娜。

黄琳娜毕业于北京大学法学院,是香港城市大学的普通法硕士,既有法院的民商事审判经验,也熟悉律师市场。辞掉上一份工作时,她面对着几个不同类型的offer举棋不定,直到元典出现。

她没怎么犹豫就答应了邹劭坤的邀请。“这一年每次对外讲座或交流,我都会泼冷水,说法律大数据是个水深坑多的行业。信任邹劭坤,是因为他对大数据的未来有深远纯粹的奇想,而且愿意付出日日夜夜的辛劳。我是个对大词儿无感的人,不爱提梦想,说服我的与其说是愿景的堂皇,不如说是诚实且认真地对待当下真实局面的态度,点滴改善,逐渐突破。”

“这也是为什么元典在成立之初,把我们的定位放在法律大数据上。无监督学习还在发展过程中,这个阶段,大数据对于智能的发展还很重要。我们想一步一步来。”


元典每间会议室的命名都有一个故事,一间名为“忒修斯之船”的会议室,则代表着元典法律团队日思夜想的研发问题的根源。

“忒修斯是一位古代英雄,为了纪念他,后人保留了他的战船。在长年的岁月里,这艘船上的每一块木板都被替换过了。在哲学上,这是同一性的问题,这艘船还是原来那艘忒修斯之船吗?挪移到法律领域,这则是一个如何识别类案的问题,一个案件就像船一样,由许许多多木板或因素组成,替换掉一个因素就可能对裁判造成实质性影响。法律科技在许多环节上的最终落地都要解决这个根本问题。”


站在会议室前,黄琳娜解释道:“譬如要做类案推送,如果所谓的类案只是同一案由,那么对法律人没有意义,因为最常见的简单案由里也有纷繁多变的案情。必须要推送跟当前案件的案情精确匹配的类案,才对法律人有真正的参考意义。两个案件里存在各种各样的因素和要件,元典将这些影响裁判的法律因素称为要素,如何让机器认知要素、从而认知整体案情,能够区分相似与不同,并且让这个区分越来越精细,是个非常有挑战的研究领域,也是我们要解决的核心问题。”

虽然最终这些智能的输出是机器来完成,但是,在研发过程中,却有广大法律人的悉心参与。与围棋、桥牌这样规则明确的事物不同,法律本身就存在大量争议和模糊地带,如何将法律人的经验智慧转化为机器的智能,并在实务场景中服务于法官、检察官、律师……这个挑战的难度、趣味和前景,或许就是吸引优秀法律人加入元典的原因。

04


“在充满答案的世界里,提出更好的问题”







2016年是国家“十三五”规划的开局之年,也是全面建设人民法院信息化3.0的第一年,最高人民法院发布了《人民法院信息化建设五年发展规划》。2017年,最高人民检察院提出了“检务大数据资源库”的规划,要全面推进国家检察大数据中心建设。可以说,法院、检察院的数据化、信息化、智能化已成为不可阻挡的历史潮流,律师端也同样感受到了这股技术的脉动。

“元典的产品线贯穿于法律生态圈,在法检领域,我们与华宇软件合作,开发了针对法院的‘睿审·智慧裁判解决方案’,以及面向检察院的‘晓督·智慧公诉辅助系统’。它们都由元典睿核提供智能支持。”张斌琦如是说,他担任元典主管产品的副总经理。


在元典的墙上,悬挂着一张中国地图,上面标注着元典与全国各省市、自治区、直辖市法院、检察院的合作。目前,围绕“智慧法院”与“智慧检务”的生态布局已具雏形。

看着那张中国地图,张斌琦露出了笑容。“我那天一来上班,老大就给我发了一条消息,问我愿不愿意去元典。我想都没想,马上回:‘愿意’。回复过了才想,我都还没跟家里人说一声呢。华宇软件决定成立元典的时候,我就在琢磨,我想去这家公司。”

张斌琦说,因为元典在做的是真正的大数据产品,他就是特别想做这个。

随着法检智能产品的成熟,元典面向互联网的重要产品,元典律师工作平台和元典智库也在不断迭代。

在元典的规划中,元典律师工作平台分为三个阶段。第一阶段,主要提供诉讼与非诉流程管理、团队协同、工时管理等功能,并且将它们作为律师行业的基建设施免费开放,让律师们不必花费高昂成本,就能得到充分的工具支持;

第二阶段,则会发挥元典睿核的优势,在法律实体问题上为律师提供专业化的智能辅助,让有着更高需求的律师能够在工具的帮助下创造更多价值;

第三阶段,是与精选的律师团队合作,帮助他们开创和优化自己的法律服务高级产品。

目前,第一阶段已经实现,元典律师工作平台的免费版本已向互联网发布,成为许多律师每天开工打开的第一个网页,也是深夜加班时仍不离左右的陪伴。随着“元典智库”今年九月开启内测,第二阶段也吹响了号角。

作为智能检索,元典智库与元典律师平台打通,将数据的帮助融汇到工作流之中。元典智库将传统的“信息检索”改造为“知识检索”,信息和知识的区别,在于信息是零散的,知识则有体系与逻辑。当律师在传统的检索工具上进行检索,他所得到的答案是关键词匹配的结果,如果关键词本身设定得不够准确,答案也难如人意;而元典智库在做的,则是利用睿核对于法律概念的认知能力和底层的知识图谱,帮助法律人在充满碎片的世界里,融合完整的视角,在充满答案的世界里,提出更好的问题。

如果用一句通俗的话来形容,元典智库的初衷就是为每位法律圈内的“福尔摩斯”搭配上一位能够从碎片化数据中推演出完整场景的“华生”。这是近期开放内测后,在元典员工的朋友圈里看到的一句话。

除了提高机器认知法律的能力,元典在成立之初就坚持在检察院、法院、律师市场进行完整产品链布局,是源于“在数据孤岛间建立连接的道路”的愿景。真正的大数据必定是“活”数据,邹劭坤在演讲时,常常引用阿里的王坚博士的这个观点,只有数据流能够在检察官、法官、律师之间流动起来,信息才能被最大程度地复用、活用,降低整个司法过程的成本,使每个接触司法的人,无论是普通当事人还是专业法律人,都从数据流的良性循环中受惠。

05


“正因为是长路,才要一起走”







每一家公司的创立,每一款产品的诞生,背后都离不开一支团队。人,是最为关键的因素。

邹劭坤曾在上海的外所从事涉外法律服务,之后在北京的检察院做公诉人,承办了大量具有典型意义的新型案件。在检察院工作几年之后,他又辗转做过私募和商事律师。从邹劭坤的经历可以看出,他是一个颇为“不安分”的人,喜欢挑战和尝试新鲜事物。在邹劭坤看来,在大数据、智能化方面,整个法律行业还较为滞后,这种滞后不仅体现在工具上,还体现在意识上。这种局面一旦改变,法律行业的生产力会被进一步激发。

邹劭坤说:“这一年时间,我最大的成就感来源于破除了自己心中对于法律行业的迷惘。如果在一片海域上,只有一个人在孤独地航行,其实并不足以冲开’蓝海’;而应当是有人在领航,后面有一群人穷追不舍,这对于领航的人才是一种激励,他才能越跑越快。”


黄琳娜曾在广东的法院系统工作过八年时间,法官生涯的烙印,使她更习惯“不吹不黑”地面对大数据和人工智能在宣传上的热闹喧嚣。新兴领域足够新鲜、有趣,周围环绕着一群优秀的伙伴,同时,它也充满挑战,市场氛围的躁动和实际研发中的艰苦付出都是需要正视和克服的问题。对这一点,她回答得很坦然:“正因为是长路,才要一起走。”

李东海、张斌琦都在法律行业的信息化领域深耕十余载,见证科技点滴改变法律行业工作方式的过程,他们多年积累和反复打磨的技术经验和产品思维是法律人所稀缺的,这也恰是这一类人对于法律科技行业的可贵之处。

在这一年里,在技术人员之外,还有越来越多的精彩法律人加入元典。除了资深实务人士,又多了许多跨界人才,他们具备法律从业背景,对新事物也有敏锐的触角,熟悉新媒体与新工具,对运营、对产品充满兴趣。随着校园招聘,北大、清华、政法……各大法学院的年轻毕业生也陆续加入。每个人加入元典的理由相似又相异,在自己的独特视角之外,有一点是他们的共性:希望以数据解锁法律的更多可能。

孙安琪,毕业于清华大学宪法与行政法专业,目前担任元典的产品工程师。此前,她曾在法院刑事庭、证监会行政复议办公室、上海律所资本市场部实习过。对比之后,她说,现在的工作让她打开了一扇新大门,在法学的视野之外,元典的产品工作让她接受了多重思维方式的洗礼。

“法律大数据,这是一个能给法律插上翅膀的行业。能够创造出法律领域的智能产品,是一件非常有成就感的事情。”这位职场新人憧憬未来之时,望向了元典办公场所深处那间叫做“达特茅斯之夏”的会议室。

纵观人类发展史,在任何一次技术革命中,能够最初获益的都是拥抱、接受、使用这些技术的人,而远离、抵触乃至拒绝的,势必会在一段时间内迷茫、滞后。目前我们无法预见,这场如火如荼进行中的大数据、人工智能变革会用多长时间来重塑法律行业的既有格局,但任何一点细微的改变、从0到1的突破,都是值得我们去关注并且尝试的。

在吴军的《智能时代》一书中,有这样一句话——“如果我们把资本和机械动能作为大航海时代以来全球近代化的推动力,那么数据将成为下一次技术革命和社会变革的核心动力。”对于法律这个历史悠久的行业,大数据也是那能够撬动整个行业发展的支点。


对于元典来说,路仍很长,但身边有同伴,眼前有海,头顶有星,这已值得这个年轻的团队,展开又一季的旅程。

责编/Ethan 编辑/Angie  分类/原创

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存