爱特曼如何让AI读懂医学数据?
爱特曼如何让AI读懂医学数据?2020年,智慧医疗行业的投资规模首次冲破千亿元大关,无论从投融资数量,还是规模来看都远超2019年整年。在资本市场看好的大环境下,IT巨头们也纷纷下
2020年,智慧医疗行业的投资规模首次冲破千亿元大关,无论从投融资数量,还是规模来看都远超2019年整年。
在资本市场看好的大环境下,IT巨头们也纷纷下海,布局这个潜力无限的“数字赛道”:
阿里方面,组建了阿里健康、阿里云,推出ET医疗大脑,瞄准医疗行业数字基础建设。
腾讯方面,自2014年开始以微信、QQ等平台流量为依托,以人工智能、云计算等技术为支持,在互联网医疗、医疗器械、医疗保险等领域构建医疗脉络。
百度方面,成立“百度灵医”(AI创新业务部),并搭建从健康医疗科普、问答、直播等内容生态到在线问诊、健康管理等健康医疗服务闭环……
创业邦持续关注的爱特曼智能(Atman)也是在智慧医疗浪潮中的一员,成立于2016年,由来自微软、百度、北大、清华、北邮等知名企业和院校的资深技术人才组成,是一家聚焦医学领域的AI机器翻译解决方案服务商,核心业务包括医学机器翻译、机器写作、循证医学、知识图谱等智慧医疗解决方案。
“医疗数据是医疗数字化、智能化的基础。但过去仅通过人工方式操作,似乎已经很难充分挖掘医疗大数据中蕴藏的价值,需要更先进智能的配套技术加速医学行业的智能化进程。”创始人&CEO马磊在接受创业邦采访时表示。
新时代下,医疗领域到底需要什么样的创新技术推动产业发展呢?
马磊给出的答案是——机器翻译,具体来说是利用计算机将一种自然语言(源语言)转换为另一种自然语言(目标语言)的操作过程。
一方面,国内外医疗资源和学术知识存在语言鸿沟,为紧跟国际化步伐,跨国药企对机器翻译的刚性需求开始显现;另一方面,以往大部分翻译工作依赖人力,亟需端到端的专业翻译服务,以减少从不同来源获取搜索结果的时间、提升工作效率,帮助其实现语义高效检索。
为了做好机器翻译工作,马磊曾两次从微软离职投身其中。
2006年,在获得清华大学计算机系硕士学位后,他顺利进入微软亚洲研究院,从事语音识别和手写识别的研究工作。2010年,马磊第一次离开微软加入创业大军,尝试将语音识别技术落地应用。这次创业因商业化路径尚未清晰,且配套技术并不成熟,最终未果。
于是在2013年,他又一次回到微软,在微软搜索技术中心负责一系列与搜索和自然语言处理相关的项目。“身在微软,但内心对创业的热情不减,他从来都是个‘爱折腾’的人。”身边的同事这样评价马磊。
2015年,马磊从北京搬到了苏州,并决定离开微软二次创业,成立“爱特曼智能”。这次创业,他的身边多了几个微软的同行人。
“2015~2016年是机器翻译发展历程中的重要临界点。在这个临界点上,第三代机器翻译技术——神经机器翻译,超越了第二代技术——统计机器翻译,快速进入了商业应用阶段”,马磊说,“并非一开始就瞄准生命科学(AI+医药)领域。在调研了20多个场景后,我们发现生命科学领域需求更高、市场增速最快,且存在明显的‘行业封闭圈’,意味着整个专业知识成体系、内部连接性更强,一旦进入市场,便很快能通过转介绍拓客,获得Top级别客户的背书。”
马磊告诉创业邦,AI机器翻译的主要应用场景集中在药物警戒和注册环节合规化方面。
在2017年正式加入ICH(人用药品注册技术要求国际协调会议)后,我国药企在创新药研发方面热情高涨,其在药品研发和注册国际化方面也已然成为趋势,这使得越来越多临床项目开启了中美双报、中欧双报甚至三地申报的战略。
若想通过国际监管部门对药品质量、安全性和有效性的高审核标准,药企就必须准确提供对应监管部门对药物审批上市的合规化佐证,如不良反应等临床数据情况。而这一切工作的背后,都离不开机器翻译。
基于对市场的准确判断,爱特曼智能快速锁定B端药企、医疗器械客户群,利用搜索、机器学习、自然语言处理技术收集和分析医学数据(包括科研文献、实验数据等),并确立了“以标准化AI机器翻译SaaS为主,大客户定制化引擎为辅”的服务模型。
现阶段,除机器翻译外,爱特曼智能还能为客户提供医疗信息化打通、数据循证等服务,以满足不同规模客户的差异化服务需求。
基于技术储备和先发优势,爱特曼智能已积累几亿个数据样本量,并在行业内率先服务了上百家全球知名药企,以及众多医疗器械企业和CRO公司。在2020年全球排名Top10的药企中,有8家是爱特曼智能的客户。
更值得一提的是,该公司医学机器翻译引擎在经过效率、机器翻译评价指标(BLEU)等多个维度评估后,连续在2019年和2020年蝉联两届获得国际机器翻译公开评测(WMT)生物医学赛道的第一名。
2021年上半年,爱特曼智能在医学机器翻译这条赛道上稳居领先位置,积累了众多客户和良好的行业口碑。2021年下半年,爱特曼智能将依托现有资源和优势,向医药行业纵深进军,探索AI在生命科学领域的第二曲线。
微软创新赋能暨生态加速计划-苏州人工智能产业创新中心推荐
文章图片来源于爱特曼智能、摄图网,经授权使用。本文为创业邦原创,未经授权不得转载,否则创业邦将保留向其追究法律责任的权利。如需转载或有任何疑问。
作者:王涵
-
传音AI翻译团队获WMT 2021国际机器翻译大赛非洲小语种方向冠军2021-07-19
-
卷积神经网络:解决图像分类、语义分割或机器翻译问题2021-01-07
-
中科院计算所副研究员冯洋:神经机器翻译的训练改进和解码提速2020-04-07
-
谷歌告诫用户不要使用机器翻译取代人工翻译2019-09-28