翻译过程需要的蛋白因子(Atman用AI)(1)

对于很多新创企业来说,选择成熟的增量市场几乎意味着进入 “竞争红海地带”,想要另辟蹊径,在小领域一枝独秀却又顾虑 “市场天花板低”,无法做大做强。不过,对于 AI 医疗新秀企业爱特曼科技(Atman)来说,这些担忧似乎并不重要。

AI 医疗的热度不言而喻,绝大部分企业都主要集中智能诊断、智能问诊、智能药物研发领域。医疗是一个庞大、复杂的系统,这是大家的共识。所以,整个行业都在积极地寻找切入口,以撬动这个巨大的市场。Atman 也希望推动 AI 医疗的发展,但是其看到的市场切入点并非当前的热门领域,而是以医药和器械领域的医学翻译场景作为切入口。

“市场上没有人做,这件事情又非常重要,这就是机会。”Atman 的 CEO 马磊说。Atman 成立于 2016 年,专注于医学领域的人工智能技术和产品的研发,旨在让人工智能更懂医学,合作并服务于从药物发现,临床开发,医学诊断,到专业教育的医学全阶段客户。其能够为客户提供 AI 赋能的医学领域翻译产品和服务,智能机器写作系统,基于知识图谱的数据分析和知识发现产品。值得强调的是,Atman 曾获得 wmt2019 生物赛道的世界冠军。上个月,通过层层筛选,其从 500 多个项目中脱颖而出,成为平安云加速器的第三期成员。

马磊介绍道,翻译在整个医药、医疗器械行业里是刚需。国际药厂把国外新药引入国内,国内的药厂把自研创新药推向欧美市场,都需要走一套监管部门的合规性检验流程,即需要证明研究结果是否符合当地的临床。这个过程中,所有的申报资料必须是中文的。“这就是一个巨大的量。每注册一款新药,需要翻译的资料有一个小卡车的容量。” 他说。

除了翻译资料量大,合规性的审查还要求高水平的翻译质量。“因为最后药品上市之后,如果申报材料有错误,整个审批文件都会被退回。” 他表示,传统方式是通过企业一层层外包给第三方公司,人工多个环节去完成一个非常体系化的事。“传统方式完成一款新药资料翻译需要六个月。” 他说。

为了解决提升翻译的效率,减少药企的损失,Atman 研发了专业的医学机器翻译产品 Transgod 。Transgod 是基于亿级医学海量数据和自研算法的神经网络机器翻译引擎, 深入理解并优化如临床前, 临床, 药物生产, 药物警戒等医学子领域。据马磊介绍,Transgod 完成一款新药研发资料翻译只需要两个半月时间。

除了翻译,Atman 也推出了综述性写作产品,即非结构化数据的处理。药厂在完成早期研发后,进入临床前的过程中,需要很多综述性的写作,即对于实验的总结记录。此外,药品进入医院后,医生也会询问很多问题,药厂需要就问题作出写作型解答,如找到相应的数据来证明这种新的化合物能够去帮助病人解决什么问题,同时它的毒性副作用是在什么规范之内的。“这种综述型写作,可以用机器来为人类提供效率。” 马磊表示。Atman 提供一个搜索引擎,医生可以设置相关得标签和要求,系统在庞大的数据资料库里基于关键词和阅读理解的能力,找到相应能支撑结论,有价值的内容。此外,Atman 也开发了医学知识图谱应用,旨在基于医学知识图谱的语义搜索、长链推理、机器写作、机器对话等应用,助力药物研究、药物开发、市场销售等药企核心业务。

而驱动应用的数据来源主要有两方面:公共数据和私有数据。据介绍,公共数据来自企业的公开数据和申请的专利。“我们团队在微软研究院和搜索技术中心有很丰富的经验,可以获取很多互联网上的生物医学数据。” 马磊说。此外,私有化数据主要来自于药厂,如在合作的过程中有限使用。

“我们公司从成立到现在,其实完成了两个阶段的进化。” 马磊对这几年的发展做了总结:

“企业其实没有绝对的壁垒。壁垒一定是动态的,人的壁垒带来了技术的壁垒,带来了产品的壁垒,带来了市场的壁垒,品牌的壁垒。” 马磊说道。

值得一提的是,Atman 已经获得两轮融资,共计 5000 万人民币。

,