0%

语言理解模块(NLP)

what? Artificial Intelligence。AI聊天机器人核心模块NLP。 why? 携手无人驾驶、VR、AR等等热门词汇并肩引领世界技术潮流 how? 基于规则(rule-based)和基于模型(model-based)

  • 什么是信息熵?

  • 是香农为量化信息价值含量的概念。并得出一个计算公式。可简单理解为信息在传输过程中损耗的价值,信息熵越大,信息的价值越低

  • 什么是模型?

  • 可以理解为一个公式y=f(x)。

  • 模型的分类?

    1. 分类模型(意图识别),输入用户的一句话,吐出一个标签,这个标签就是这句话的意图(intent)
    2. seq2seq判别模型(实体提取),从上面这句话中提取实体(entity)。 ex: 比如,我要一张从北京到上海的机票 分类模型会输出“购买机票”的意图 seq2seq判别模型会抽取“北京”为出发地,“上海”为目的地
  • 如何获取模型?

    1. 模型是基于数据,经由训练得到的。
  • 什么是数据?怎么获取训练集?如何评估训练集的质量?

  • 什么是训练?如何训练?