原创 百分點大數據技術團隊:信息共享交換體系在政務服務中的應用研究

編者按 數據是政務工作的重要資源之一。近年來,政府出臺的信息化政策中多次提及“互聯網+政務服務”這個概念,表明頂層實行現代化治理的決心,但是數據煙囪、信息孤島等問題仍然存在,已成爲政府工作中不可避免的問題。百分點在政府大數據平臺建設中,構建

原创 百分點大數據技術團隊:ClickHouse國家級項目最佳實踐

編者按ClickHouse自從2016年開源以來,在數據分析(OLAP)領域火熱,各個大廠紛紛跟進大規模使用,百分點在某國家級項目中的完成了多數據中心的ClickHouse集羣建設,目前存儲總量超10PB,日增數據100TB左右,預計流量今

原创 百分點認知智能實驗室出品:情感分析在輿情中的研發實踐(上)

編者按文本情感分析是對帶有主觀感情色彩的文本進行分析、處理、歸納和推理的過程。互聯網上每時每刻都會產生大量文本,這其中也包含大量的用戶直接參與的、對人、事、物的主觀評價信息,比如微博、論壇、汽車、購物評論等,這些評論信息往往表達了人們的各種

原创 一文講透預訓練模型的改進訓練算法 ,輕鬆達到State of the Art

編者按隨着BERT在NLP各種任務上取得驕人的戰績,預訓練模型在不到兩年的時間內得到了很大的發展。BERT和Open-GPT等預訓練語言模型的引入,使整個自然語言研究界發生了革命性的變化。然而,與它們巨大的好處相比,研究人員對它們的理論和經

原创 百分點大數據評測報告:開源OLAP引擎綜評(HAWQ、Presto、ClickHouse)

編者按談到大數據就會聯想到Hadoop、Spark整個生態的技術棧。大家都知道開源大數據組件種類衆多,其中開源OLAP引擎包含Hive、SparkSQL、Presto、HAWQ、ClickHouse、Impala、Kylin等。當前企業對大

原创 百分點認知智能實驗室出品:深度遷移學習十八問

編者按 深度遷移學習是基於深度神經網絡的遷移學習方法,BERT通過預訓練模型達到深度遷移學習的效果,自從2018年底BERT橫空出世以來,就以勢不可擋的姿態橫掃了衆多榜單,甚至在閱讀理解任務SQuAD 中超越人類水平。BERT在公檢法、媒體