第243章 拔剑四顾心茫然? (第2/3页)
然不是。 涉及到自然语言处理方面真要说来钱最多的还得是狭义知识。 狭义知识同样是自然语言处理方面的知识来源。 应用于自然语言处理项目的知识来源主要有三大类: ——狭义知识、算法和数据。 古语云,书中自有黄金屋。 真实意义上的黄金屋虽然不尽然。 但知识能用来换钱,这个众所周知。 既然知识能够用来换钱。 那么知识来源的手段自然也能用来换钱。 甚至于知识来源手段很可能比知识本身来钱更快。 作为自然语言处理的知识来源的算法和数据能换钱。 同样作为自然语言处理知识来源的狭义知识自然一样是能够换钱的。 对于算法能换钱的基本上为世人所周知。 即便是此前不知道这个能换钱的如果长时间关注林灰前段时间的所忙碌的重点也能清楚。 此前牵扯林灰多数时间的基本都是生成式摘要算法这件事。 无利不起早,没有足够的利益驱动林灰自然不会为这件事鞍前马后。 算法能换钱这件事基本不难懂。 算法往往直接影响一些算法驱动型产品的效率。 而效率就是真金白银。 能够直接影响效率的算法自然是能够很容易换取丰厚报酬的。 理解了算法能换钱。 其实也就不难理解数据为什么能换钱。 毕竟数据是很多机器学习算法构建的基石。 机器学习算法的出现往往要依赖于有标注的数据。 而且在相当长的一段时期内机器学习算法不仅是依赖于有标注的数据。 而且是依赖于大量有标注的数据。 标注数据量较小的情况下,很多时候是不足以训练一个性能优异的机器学习算法的。 从这个角度出发,就不难理解数据为什么可以换钱。 很多时候甚至可以完全可以把数据理解为是一种隐性的知识。 而数据标注的过程实际上就是将散漫自有的离散数据结构化、标签化的过程。 在算法和数据之外,所谓的狭义知识是什么呢? 狭义知识一般指通过规则或词典等形式由人工定义的显性知识。 狭义知识主要包括三种: ——即语言知识、常识知识和世界知识。 其中,语言知识是指对语言的词法、句法或语义进行的定义或描述。 其主要特色是定义了同义词集合。每个同义词集合由具有相同意义的词组成。 常识知识是指人们基于共同经验而获得的基本知识。 世界知识包括实体、实体属性、实体之间的关系等。 或许有人不理解? 为什么这类知识能换钱呢? 这些东西不都是显而易见吗? 这些知识虽然本质上依旧是人们所能理解的显性知识。 但对人们来说显而易见的显性知识,不等于对机器是显而易见的。 对于这类知识往往要通过规则化或者是词典化将这些知识整理成让机器理解的形式。 这类知识往往通过知识图谱的形式加以描述和存储。 常识往往是不言自明的,并没有记录为文字,所以很难从文本中挖掘到。 著名的Cyc项目试图将上百万条知识编码成机器可用的形式,用以表示人类常识。 狭义知识也被称为专家知识。 最早涉及到自然语言处理方面的模型数据的
请记住本站永久域名
地址1→wodesimi.com
地址2→simishuwu.com
地址3→simishuwu.github.io
邮箱地址→simishuwu.com@gmail.com