• 约193条记录,页面显示在80条内,推荐使用搜索获取文章发布时间       点击
  • 2018-01-29     32

    Raft 是一种用来管理日志复制的一致性算法。它和 Paxos 的性能和功能是一样的,但是它和 Paxos 的结构不一样;这使得 Raft...

  • 2018-01-29     27

    向量时钟实际是一组版本号(版本号=逻辑时钟),假设数据需要存放3份,需要3台db存储(用A,B,C表示),那么向量维度就是3,每个db有一个版本号,从0开始,这样就形成了一个向量版本 [A:0, B:0, C:0];

  • 2018-01-08     36

    分治法和动态规划都是通过将问题分解成子问题,通过子问题的求解,实现对整个问题的求解。

  • 2018-01-08     34

    贪心算法(又称贪婪算法)是一种能够得到某种度量意义下的最优解的分级处理方法,它总是做出在当前看来是最优的选择,也就是说贪心策略并不是从整体上加以考虑,它所做出的选择只是在某种意义上的局部最优解算法。

  • 2017-12-08     33

    该算法其实是一个简单的弱分类算法提升过程,这个过程通过不断的训练,可以提高对数据的分类能力

  • 2017-09-21     38

    Merkle Tree,通常也被称作Hash Tree,顾名思义,就是存储hash值的一棵树。Merkle树的叶子是数据块(例如,文件或者文件的集合)的hash值。非叶节点是其对应子节点串联字符串的hash。

  • 2017-09-11     39

    BM25算法则从概率模型理论出发推演出的一套相关性计算公式。相比TF-IDF算法还是复杂很多

  • 2017-09-08     40

    BM25(Best Match25)是在信息检索系统中根据提出的query对document进行评分的算法。It is based on the probabilistic retrieva...

  • 2017-08-09     41

    对于一般损失函数,为了使其取得最小值,通过梯度下降算法,每次朝着损失函数的负梯度方向逐步移动,最终使得损失函数极小的方法(此方法要求损失函数可导)

  • 2017-08-09     38

    Xgboost是GB算法的高效实现,xgboost中的基学习器除了可以是CART(gbtree)也可以是线性分类器(gblinear)。