原创 分佈式文件系統ChubaoFS開源
ChubaoFS(儲寶文件系統,簡稱CFS)是京東自研的分佈式文件系統,設計初衷是爲了京東容器集羣提供持久化存儲方案,同時也可作爲通用雲存儲供業務方使用。 ChubaoFS的設計有其獨到的特點,名爲《CFS: A Distribut
原创 Prometheus在京東開源項目ChubaoFS中的使用
在我的印象中,普羅米希修斯是古希臘神話中的最具智慧之神,不僅創造了人類,還給人類帶來了火。同樣Prometheus項目也是非常優秀的項目,很早就引起了我們的興趣,在近期ChubaoFS項目中,我們也啓用了Prometheus作爲其監控系
原创 算法實現系列第二章.堆排序
說白了就是二叉樹排序..java中hashset中非基本數據類型的對象比較就是用的這個方式... package binarytree; public class BinaryTree { public static voi
原创 算法實現系列第一章.冒泡排序
package algorithm; public class Bubbling { public static void main(String[] args) { int[] ints = {123,1,31,31,43
原创 算法實現系列第五章.viterbi算法
package algorithm;public class Viterbi { /** * 維特比算法(Viterbi algorithm)是一種動態規劃算法。它用於尋找最有可能產生觀測事件序列的-維特比路徑-隱含狀態序列,特別是在馬
原创 感知機-Percepron
代碼說明:w和b爲感知機模型參數,w就是weight叫做權值,或者叫weight ector, 叫做偏置,(bias)f(x) = w.x+bpackage org.ansj.ml;import java.
原创 算法實現系列第六章.桶排序
package algorithm;/** * 桶排序 * @author ansj * */public class BucketSort { /** * 這個排序算法很噁心.但是容易寫我湊個數呵呵 * @param args *
原创 elasticsearch 常用備忘
關閉服務:curl -XPOST 'http://localhost:9200/_shutdown'顯示log./elasticsearch -f
原创 算法實現系列第四章.啓發式搜索_A*搜索
..很鬱悶啓發式搜索和A*搜索.自己對照文檔寫了下..發現和之前學的有出入...算了先寫這個吧..等我回去翻翻筆記...如果有問題再來補充..明白的同學可以直接拍磚... 下面我們對這個圖進行..最短路徑的查 package a
原创 兩個大數字相乘
沒什麼只是.一個demo package net.csdn.service.tag.impl; import java.util.ArrayList; import java.util.HashMap; import java.
原创 算法實現系列第三章.快速排序
先剽竊jdk的... package algorithm; import java.util.Arrays; /** * 快速排序,哦也 * * @author ansj * */ public class Quic
原创 一晚上整理出來的激動
每種詞性的概率 1 4 a ad ag an b c d dg e f h k l m mg n ng nr ns nt nz o p q r rg s t tg u v vg vn w y z
原创 Totoro中文分詞第二版上線啦
經過不懈的努力.耗費了畢生經歷.終於把分詞寫完了.事後覺得太過複雜的東西真的不是好玩的..可控性太差了.推翻恢復.重寫.優化經歷了一晚上.終於得道了一個還算滿意的答案.呵呵廢話不多說了..老規矩.我先介紹下
原创 一些分詞中用到的公式-參考ictclas
//計算平滑係數公式//平滑參數dSmoothingPara = 0.1//設置當前節點的頻度,如果是已知詞性,直接使用頻度dCurFreqency//一個參數static int MAX_FREQUENCE = 2079997;//
原创 介紹一種基於角色標註+字詞體位法的人名識別方式-Ansj中文分詞
大家好.最近在做分詞.在分詞中遇到了各種各樣的問題.在這裏選擇一個比較有意思的與大家分享. 在這裏說分詞有點老生常談了.的確.中文分詞已經非常成熟了.但是在實體名識別上一直是中文分詞的軟肋.最近