原创 分佈式文件系統ChubaoFS開源

ChubaoFS(儲寶文件系統,簡稱CFS)是京東自研的分佈式文件系統,設計初衷是爲了京東容器集羣提供持久化存儲方案,同時也可作爲通用雲存儲供業務方使用。   ChubaoFS的設計有其獨到的特點,名爲《CFS: A Distribut

原创 Prometheus在京東開源項目ChubaoFS中的使用

在我的印象中,普羅米希修斯是古希臘神話中的最具智慧之神,不僅創造了人類,還給人類帶來了火。同樣Prometheus項目也是非常優秀的項目,很早就引起了我們的興趣,在近期ChubaoFS項目中,我們也啓用了Prometheus作爲其監控系

原创 算法實現系列第二章.堆排序

說白了就是二叉樹排序..java中hashset中非基本數據類型的對象比較就是用的這個方式...   package binarytree; public class BinaryTree { public static voi

原创 算法實現系列第一章.冒泡排序

package algorithm; public class Bubbling { public static void main(String[] args) { int[] ints = {123,1,31,31,43

原创 算法實現系列第五章.viterbi算法

package algorithm;public class Viterbi { /** * 維特比算法(Viterbi algorithm)是一種動態規劃算法。它用於尋找最有可能產生觀測事件序列的-維特比路徑-隱含狀態序列,特別是在馬

原创 感知機-Percepron

代碼說明:w和b爲感知機模型參數,w就是weight叫做權值,或者叫weight ector, 叫做偏置,(bias)f(x) = w.x+bpackage org.ansj.ml;import java.

原创 算法實現系列第六章.桶排序

package algorithm;/** * 桶排序 * @author ansj * */public class BucketSort { /** * 這個排序算法很噁心.但是容易寫我湊個數呵呵 * @param args *

原创 elasticsearch 常用備忘

關閉服務:curl -XPOST 'http://localhost:9200/_shutdown'顯示log./elasticsearch -f

原创 算法實現系列第四章.啓發式搜索_A*搜索

..很鬱悶啓發式搜索和A*搜索.自己對照文檔寫了下..發現和之前學的有出入...算了先寫這個吧..等我回去翻翻筆記...如果有問題再來補充..明白的同學可以直接拍磚...   下面我們對這個圖進行..最短路徑的查   package a

原创 兩個大數字相乘

沒什麼只是.一個demo     package net.csdn.service.tag.impl; import java.util.ArrayList; import java.util.HashMap; import java.

原创 算法實現系列第三章.快速排序

先剽竊jdk的... package algorithm; import java.util.Arrays; /** * 快速排序,哦也 * * @author ansj * */ public class Quic

原创 一晚上整理出來的激動

每種詞性的概率 1 4 a ad ag an b c d dg e f h k l m mg n ng nr ns nt nz o p q r rg s t tg u v vg vn w y z

原创 Totoro中文分詞第二版上線啦

經過不懈的努力.耗費了畢生經歷.終於把分詞寫完了.事後覺得太過複雜的東西真的不是好玩的..可控性太差了.推翻恢復.重寫.優化經歷了一晚上.終於得道了一個還算滿意的答案.呵呵廢話不多說了..老規矩.我先介紹下

原创 一些分詞中用到的公式-參考ictclas

//計算平滑係數公式//平滑參數dSmoothingPara = 0.1//設置當前節點的頻度,如果是已知詞性,直接使用頻度dCurFreqency//一個參數static int MAX_FREQUENCE = 2079997;//

原创 介紹一種基於角色標註+字詞體位法的人名識別方式-Ansj中文分詞

大家好.最近在做分詞.在分詞中遇到了各種各樣的問題.在這裏選擇一個比較有意思的與大家分享. 在這裏說分詞有點老生常談了.的確.中文分詞已經非常成熟了.但是在實體名識別上一直是中文分詞的軟肋.最近