• 约550条记录,页面显示在80条内,推荐使用搜索获取文章发布时间       点击
  • 2019-07-19     3

    利用LabelEncoder() 将转换成连续的数值型变量。即是对不连续的数字或者文本进行编号

  • 2019-01-24     51

    布尔模型和向量空间模型可以给出文档内容和查询是否相关的非确定性的推测,而概率论的方法可以给这种推测提供一个基本的理论。

  • 2018-11-21     52

    在数据挖掘中,经常会存在不平衡数据的分类问题,比如在异常监控预测中,由于异常就大多数情况下都不会出现,因此想要达到良好的识别效果普通的分类算法还远远不够,这里介绍几种处理不平衡数据的常用方法及对比。

  • 2018-11-19     58

    第一种方法是修改训练算法,使之能够适应不平衡数据。著名的代价敏感学习就是这种方法。另一种方法是操作数据,人为改变正负样本的比率。

  • 2018-09-25     34

    基于某个 document 的 QA 系统,一般来说假定问题答案出现在了文档中。这是我们要做的项目,之后再具体介绍

  • 2018-09-20     36

    知识表示(knowledge representation)是指把知识客体中的知识因子与知识关联起来,便于人们识别和理解知识。知识表...

  • 2018-08-28     26

    因此两个0到1之间的数相乘,得到的结果就会变得很小了。神经网络的反向传播是逐层对函数偏导相乘,因此当神经网络层数...

  • 2018-08-21     40

    词性标注:将句子中兼类词的词性根据上下文唯一地确定下来。

  • 2018-08-21     53

    给定一个自然语言的句子,识别出其中出错的汉字或词语,并对其进行纠正。常被用于搜索引擎、问答系统和字处理软件中

  • 2018-08-10     32

    MXNet使用多值输出的符号表达式来声明计算图。符号是由操作子构建而来。一个操作子可以是一个简单的矩阵运算“+”,也可以是一个复杂的神经网络里面的层