资讯
了解行业以及华进新闻资讯。
纯干货!专利英文检索技巧
2021-01-07
>>> 前 言
专利英文检索是很多从业者检索能力中较薄弱的一个环节,相信一定会有人对专利英文检索存在一些困惑,在表达英文关键词时总是让人感觉很混乱。
例如:
有什么好用的翻译软件可以帮助更全面拓展英文关键词?
如何用一两个形式全面表达英文单词的诸多词形变换?
当双引号“”遇到通配符(*?$)时怎么办?
当英文词组中可能有“-”的时候怎么办?
如何用几个简单的表达方式涵盖英文词组所有组合的可能性?
今天,笔者就将结合自己的专利英文检索经验,针对一些问题介绍一些检索小技巧,希望能够对大家有所帮助。
>>> 技巧 1
全面拓展英文关键词
在进行英文关键词拓展时,我们以关键词“电阻”为例,通常会用中文在数据库里面检索,然后看看数据库中的英文是如何表达该关键词的,像下图这样。
这样做在一定程度上有助于收集表达电阻的多个英文表达,但是会增加人工的阅读量,需要阅读很多专利才能收集到较多的“电阻”的英文表达方式。
那么如何提高效率,如何更有助于全面拓展英文关键词呢?
这里笔者推荐一个小工具:一本词典(http://www.onedict.com/),笔者在此前发表的文章中已经介绍过(新创性检索——基本策略指引)。该工具基本界面如下。
该工具的特点在于其翻译均是来自于专利文献、学术论文、科技材料等,且绝大多数是对专利文献中的英文表达方式的统计,因此准确性相对较高,且该工具会对翻译结果进行数据统计排名,有助于用户选择相关性高的英文表达方式,此外还会提供中文相关联的关键词,具体如下图所示。
>>> 技巧 2
英文单词诸多变形的表达
英文单词与中文最大的不同就是词形变换,下面就介绍几种常见的英文单词的表达方法:
(1)几种常见的单复数的表达形式
①加s的情形:
在Incopat数据库中,可以用car$一个表达代替car与cars。
释义:$代表零个或者一个字符。
②加es的情形:
在Incopat数据库中,可以用bus$$一个表达代替bus与buses,但这也可能带来一定的噪音,例如该表达涵盖了busy,那么为了去掉这个噪音,可以进一步改进为bus$$ not bus?,不过如果这样表达不如干脆直接就用bus or buses。
释义:?代表一个字符。
③变y为i加es的情形:
在Incopat数据库中,可以用cand$$$一个表达代替candy与candies,但这也可能带来一定的噪音,去噪方法可以同样参照上文。
④变f或fe为ves的情形:
在Incopat数据库中,可以用kin?e$一个表达代替kinfe与kinves。
(2)同一个单词的不同拼写
例如color和colour都是颜色的意思,在Incopat数据库中可以用colo$r来同时表达上述两个词。
(3)时态、词根、词缀变化
时态,词根,词缀的变化通常使用*即可,在Incopat数据库和智慧芽数据库均适用。*的使用相对简单,本文不再赘述。
划重点了,下文内容将是本文的重点。
>>> 技巧 3
英文词组双引号“”遇到通配符(*?$)的表达
专利英文检索的时候,可能会遇到需要用双引号“”表达一个词组的时候,例如“cross link”,但是可能还有“cross linking”、“cross linked”、“cross linkable”等,按照通常思路,一般我们会想到用“cross link*”表示全部情况,但是目前常用的数据库通常都不支持引号""和通配符(*?$)的同时使用,那面对这种情况我们怎么办?有一种常规解决办法:我们可以把cross与link的所有组合形式全列出来,像这样“cross link” or “cross linking” or “cross linked” or “cross linkable”。
这时候灵魂拷问一下自己:
全了吗?不知道?不确定?应该全了吧?
哎呀,算了,时间有限~
就想到这么多种表达形式,那就这样吧~
这样检索出来的结果全面吗?(做海外FTO靠谱吗?)
其实上面的罗列是不全的,笔者英文水平也比较一般,但是笔者知道至少还有一些形式“cross links” or “cross linker” or “cross linkers” or “cross linkability”,那会不会还有“cross linkabilities”?
艾玛,想到这里,我不禁吓出一身冷汗,只想静静~~~
即使真的能够把所有的可能性都罗列出来,这也会带来一个问题,那就是我们要面对一个复杂的基本检索要素表,后面还要面对冗长的检索式,带来的检索感受可能也不太好......
那现在怎么办?笔者总结了一种简单的表达方式,具体如下:
(1)智慧芽数据库中的表达方式:
(cross $PRE0 link*)
释义:$PREn两个限定位置顺序的关键词之间间隔不超过n个单词;
如果cross和link是没有位置关系的,那么可以用下面的表达方式:
(cross $W0 link*)
释义:两个无位置顺序的关键词之间间隔不超过n个单词或n个中文字;
(2)Incopat数据库中的表达方式:
(cross (0w) link*)
释义:w检索的每个单词均已指定顺序。如果前加数字,则代表在两个关键词之间插入0~n个单词;
如果cross和link是没有位置关系的,那么可以用下面的表达方式:
(cross (0n) link*)
释义:n检索包含指定检索词且词序任意的记录。如果前加数字则代表两个关键词之间插入0~n个单词;
>>> 技巧 4
英文词组中间有字符“-”的表达
英文词组的表达在英文中经常可能带有“-”符号,例如cross-link、cross-linking、cross-linked、cross-linkable等,此时应该如何表达?
(1)智慧芽数据库中的表达方式:
字符“-”位于单词之间的时,智慧芽是将其作为正常的字符解释的,因此上述情况在智慧芽中可以用cross-link*全部表达
(2)Incopat数据库中的表达方式:
字符“-”位于单词之间的时,系统会将其处理为空格,即cross-link等同于“cross link”,因此上述情况在Incopat中可以用(cross (0w) link*)全部表达。
>>> 技巧 5
英文词组的全部组合方式的表达
英文词组有多少种可能的组合方式呢?想必很多人在检索的时候也都会被各种组合方式所折磨吧,还是以“cross link”为例,在专利文献中的词组组合方式应该主要有三种:“cross link”、cross-link、crosslink,再加上各种时态、词根、词缀的变化,组合方式就更多了,前文第4节就列举了9种变化,如果再乘以3,那就是27种变化,而且还不一定能够穷尽,显然我们不能把这27种情形全部列到检索要素表中,综合前文的表达方式,现给出较为理想的英文词组的全部组合方式的表达方式
(1)智慧芽数据库中的表达方式:
(cross $PRE0 link*) or cross-link* or crosslink*
(2)Incopat数据库中的表达方式:
(cross (0w) link*) or crosslink*
上述的表达方式相对就比较简洁了,两三种表达方式就能够涵盖众多英文词组组合的可能性,检索更加全面,检索效率也更高。
以上是笔者个人在专利英文检索过程中总结的一些经验,如果有错误或不当之处,请及时联系笔者修改或删除,欢迎业内同仁探讨、交流、指正。
华进知识产权运营事业部汇聚了国内知识产权行业精英,向科技创新型企业提供与产品研发及销售深度匹配的一站式、多维度、定制化、实战型的知识产权解决方案。
华进知识产权运营事业部基于企业的实际需求,组建“资深企业IPR+专利律师+前专利审查员”项目团队,提供深度定制、高度务实的专利侵权调查、技术主题检索分析、高价值专利培育、无效检索等知识产权咨询服务,将知识产权映射到企业经营的关键环节,构建企业知识产权攻防体系,培育企业知识产权核心竞争力。
目前团队超过50人,形成了北京、上海、广州、深圳、杭州、武汉、长沙、西安、苏州等多城市的咨询业务战略布局。每年服务的客户超过100家,且呈逐年倍增趋势。
华进官方微信公众号
Copyright © 2021 新澳门1肖1码中特.All Rights Reserved.粤ICP备12081038号