#本文仅代表作者观点,不代表IPRdaily立场#
“首家向用户开放免费注册的生物序列商业数据库。”
来源:IPRdaily中文网(iprdaily.cn)
引言
FTO(Freedom to Operate)专利检索与分析是医药企业评估专利侵权风险的有效手段,充分掌握并实施FTO专利检索与分析有助于医药企业更好地降低风险、减少损失。在进行FTO调查的过程中,检索数据库的选择至关重要。FTO检索是查全性检索,如果选择的数据库检索不全面,就会增加一定的侵权风险,因此保证检索式命中结果的全面性和准确性,至关重要。
在生物医药领域FTO专利检索中,除了利用专利数据库构建检索式外,对于生物序列的检索,还要使用特定的生物序列检索工具进行检索。
2023年6月,智慧芽旗下生物序列数据库(简称"Bio")重磅上线全球首个通式序列比对算法,检索专利中隐藏的“万亿序列”的通式序列。同年10月,Bio免费版正式上线并开放注册。
现在扫码立即抢先免费体验!
一、通式序列检索辐射万亿序列
背景:专利撰写人员会在序列中引入简并符、通配符和运算符等信息,并通过大段解释性文档描述这些符号的具体参数。通式序列并不具备生物学意义,它主要用于扩展专利的保护范围并设置搜索障碍。传统的序列同源性比对算法并没有考虑到这种通式序列的情况,因此使用传统算法进行搜索存在漏检风险,无法找出所有潜在目标序列。
根据智慧芽生物序列数据库统计显示,在全球专利文献中,这种特殊的通式序列数量并不低:核酸约740万条,占总核酸数的7.12%;蛋白序列131万条,占总蛋白序列数的7.55%。这表明大量的通式序列,由于特殊符号的存在,会对检索结果产生影响,对于序列FTO来说风险非常高。
例如,查询序列
"EVGSYPAPSDACPSDYFYCDASGRSAGGGGTENLYFQGSGGS",
在命中目标序列时,
"EVGSYXXXXX XCXXXXXXCX XSGRSAGGGG TENLYFQGSG GS"。
使用传统序列方式检索,BLAST算法的相似度仅为67%,但实际上相似度为100%。这种生物序列通过常规算法搜索会导致两种情况:要么序列无法搜索,要么由于相似度低于阈值而被排除在结果之外。无论哪种情况,都会给序列搜索人员带来不便,无法方便地与权利要求进行同源性比较,甚至会漏检关键序列信息。
为了解决通式序列带来的漏检风险,智慧芽算法工程团队利用自研的NLP、CV、实体识别、指代消解等技术,构建了深度学习模型,用于识别和解析序列表和专利全文中的通式序列及其取代信息,并建立了通式序列检索库。
图:智慧芽生物序列数据库通式序列检索入口
该库通过特殊的序列比对算法,在通式序列检索时不仅能够搜索这类序列,还能返回真实的相似度。智慧芽的通式序列检索解决方案能够进一步降低在专利FTO和查新工作中的漏检风险。
图:智慧芽生物序列数据库通式序列检索示意
二、Bio免费版全面开放注册
常见的公共免费序列检索数据库,往往存在专利数据收录不全、算法以及保密等问题,不适合用于严谨的防侵权分析。所以,在进行FTO专利检索与分析时,常选择数据收录和算法均能满足防侵权分析的商业数据库进行序列检索。智慧芽Bio作为主流商业数据库之一,今年10月重磅宣布免费版正式上线并开放注册。欢迎新老用户扫码注册使用!
无论您是致力于开发新型癌症治疗方法的生物科学家,希望了解可能影响药物反应的不同序列变异,还是需要进行成果序列可专利性分析及FTO工作的知识产权律师,智慧芽生物序列数据库均是帮助您解锁和理解复杂生物序列的重要工具。
免费版权限:常规搜索、短序列搜索、Motif搜索各5次、可使用变异过滤查看变异报告、可查看来自序列索引专利、序列索引公开库、人工标注序列的50条序列详情。
免费版申请及使用入口:bio.zhihuiya.com
数据全面准确:智慧芽生物序列数据库收录海量全球生物序列相关数据,并基于AI与人工标注数据,高效保障准确性,满足用户的序列检索分析需求。
功能丰富:
功能:通式检索、常规检索、短序列检索、Motif搜索、片段搜索、组合检索、抗体搜索、药物/基因索引
工具:序列助手、序列比对、工作空间、邮件提醒、sequence_suite、高级设置、过滤筛选
图:智慧芽生物序列数据库功能
图:抗体检索结果
图:序列助手示意图
检索清晰便捷:检索简单易上手,界面友好,数据库部分界面截图如下:
现在扫码立即抢先免费体验!
为了提升您的检索体验
电脑端请访问生物序列数据库官网
bio.zhihuiya.com
生物序列专利检索场景案例
CAR-T领域有哪些检索方式能找到更多更全的技术资料和专利信息
(原标题:智慧芽生物序列数据库「通式序列+免费版」王炸组合等你来!)
来源:IPRdaily中文网(iprdaily.cn)
编辑:IPRdaily辛夷 校对:IPRdaily纵横君
注:原文链接:免费试用!智慧芽上线全球首个通式序列比对算法,检索专利中隐藏的“万亿序列”的通式序列(点击标题查看原文)
「关于IPRdaily」
IPRdaily是全球领先的知识产权综合信息服务提供商,致力于连接全球知识产权与科技创新人才。汇聚了来自于中国、美国、欧洲、俄罗斯、以色列、澳大利亚、新加坡、日本、韩国等15个国家和地区的高科技公司及成长型科技企业的管理者及科技研发或知识产权负责人,还有来自政府、律师及代理事务所、研发或服务机构的全球近100万用户(国内70余万+海外近30万),2019年全年全网页面浏览量已经突破过亿次传播。
(英文官网:iprdaily.com 中文官网:iprdaily.cn)
本文来自IPRdaily中文网(iprdaily.cn)并经IPRdaily.cn中文网编辑。转载此文章须经权利人同意,并附上出处与作者信息。文章不代表IPRdaily.cn立场,如若转载,请注明出处:“http://www.iprdaily.cn”
文章不错,犒劳下辛苦的作者吧