执行与训练 – 涉及机器学习的专利申请撰写时的注意事项

人工智能领域已经逐渐进入到各行各业,为很多场景提供智能化服务。在IT领域以及传统制造业和服务业,都能看到人工智能的身影。智能化代替人工操作,降低人工成本,这也是未来发展的必然趋势。而谈到人工智能,首先想到的便是机器学习,所谓机器学习就是机器通过对一些已有数据(经验)的学习,从而能够完成一些任务。关于机器学习模型的基础介绍可以参考其他文章。

近年来企业对机器学习方面的专利申请需求也越来越多,机器学习是完全不同于传统行业的新型技术。那么涉及新型技术的专利写法自然也需要有新的研究,如果撰写的方式不合理,会直接导致此类技术的专利权的保护范围受限、提高采集侵权证据的难度等。鉴于此,本文将结合机器学习领域的专利撰写实践,浅谈涉及机器学习的专利撰写时的注意事项。

机器学习基础:技术方案理解的充分性

技术理解是任何专利撰写的基础,机器学习也不例外。甚至,对于机器学习来说,充分理解的必要性更大。

举一个简单的例子,化学领域,代理人可能不太理解添加某个成分是为什么,但是至少在发明人给的方案基础上来撰写申请文件,技术错误的概率不大,可能存在的是撰写质量问题。但是对于机器学习领域,分不清模型应用和训练,不清楚标签、损失函数的关系,不论是申请人在哪个环节上创新,撰写时都可能导致技术错误。

机器学习在技术实现时,一般分为模型训练和模型执行阶段。模型训练阶段指的是利用机器学习算法对已有样本数据进行学习,以训练模型的阶段;模型执行阶段是指利用训练好的模型对新数据进行预测的阶段。在实际的技术研发过程中,有时会在模型的训练阶段进行改进,有时会对模型的执行阶段进行改进,有时可能会对现有的模型结构进行改进。另外,机器学习模型应用在不同领域时,其应用也会有所区别。因此,进行撰写前,需要清楚地理解技术,这可以让我们少走很多弯路,撰写更加地清楚顺畅。总的来说,机器学习的技术理解主要分以下几个方面:

  • 模型应用:模型执行的输入和输出
  • 模型训练:训练数据、标签、损失函数
  • 模型结构

清楚理解机器学习模型的技术方案,方能进入后续的高质量撰写步骤。

结合取证的难度,合理的逻辑撰写技术点

如上所述,模型分应用(或执行)和训练两个阶段。从技术本身的角度,只有训练了才能应用,专利撰写也是按这个逻辑吗?最好不是,这个答案来自取证的考虑。从取证难度来说,训练远比执行难。一方面,模型训练一般在后台完成,但是模型应用有可能在前台(比如,用户终端等)完成,这导致模型训练的取证难度要远远大于模型的执行。另一方面,是因为模型应用的市场价值远大于模型训练的市场价值。例如,模型训练有可能一次性完成,而模型训练好后是可以被重复应用,而且有可能被移植应用。在实际应用中,有些企业主要负责模型算法研究,进行模型训练;从而为其他多家企业提供训练好的模型,则其他多家企业会同时应用这一模型实现其产品功能。也就是说模型应用再现的可能性要比模型训练再现的可能性要高得多。这也变相说明了,模型训练的规避更容易。

那撰写逻辑是什么样的呢?

首先,模型的执行部分和训练部分要分开描述,并且更优的方式是优先说明模型是如何执行的,执行部分描述清楚后,再进行模型训练的说明。这使得说明更加清楚。其次,因为执行的取证更容易,建议优先考虑构建模型应用的权利要求,再考虑构建模型训练的权利要求。

充分考虑保护范围,考虑机器学习的替代性和上位

机器学习模型有些技术点的可替代性比较强,比如,机器学习模型分类,可以实现分类的模型有很多,SVM、DNN等等。如果在撰写时,直接固定到一种,自然保护范围很窄还容易被规避。所以考虑可替代性、适当上位对于机器学习的专利撰写非常重要。

合理把握保护的重点或者说创新的点,基于点来保护,而不是全面保护。比如,如果创新点在于模型的执行上,具体是输入了A,但是撰写时我们对模型的类型进行限制,具体的权要描述是将A输入B模型中,这就偏离了创新的点,反而影响了范围。

此外,撰写时也需要注意对保护的重点进行适当的上位。简单来说,如果创新的点是损失函数,具体为对某些损失项添加权重参数,那我们是直接保护损失函数的公式吗?当然不是,暂且不谈公式是否存在客体问题(即,是不是专利保护的主体),公式本身就是一大限制。通过语言描述来阐述公式远比公式本身的意义大。例如,“对损失项进行加权确定损失函数”这样的描述在解读时,比直接使用损失函数的公式本身空间更大。如,加权可以解读成加权求和、加权平均,或者在加权基础上再增加其他参数等等。

总的来说,在机器学习技术上面,对特征进行合理的上位不容忽视。

总结

综上,在撰写机器学习相关的专利申请时,理解清楚技术,搞清楚发明的重点是非常重要的,其会影响整个申请的权要布局以及说明的侧重点。同时,撰写过程中也需要注意不同内容的撰写顺序、以及相关技术特征的说明方式、详略程度,以提高申请文件的质量。当然,在撰写机器学习相关的专利申请时,还有很多其他需要注意的因素,以上内容仅供参考。机器学习本身涉及的知识非常广阔,技术也还在不断地发展更新,如有疏漏之处欢迎补充指正。

参考资料:

隆天律丛∣浅谈涉及机器学习专利的撰写思路

5个方法教你学会撰写机器学习相关的专利申请文件