原创 煉丹記之實戰LSTM搭爐煉丹
寫在前面:爐是垃圾爐,丹是垃圾丹(結的丹中age最高只有0.369,還沒我用catboost刷出來的高) 騰訊2020廣告算法大賽地址:https://algo.qq.com/ 前一篇博文寫了如何構造embedding vector,並且
原创 煉丹記之在非典型NLP領域使用word2vec構造特徵
最近各種競賽上對時序數據進行embeding很火、效果很好,比如數字中國2020的智慧海海建設中rank1的分享,譬如2020騰訊廣告大賽。 爲了上分,NLP小白一枚不得不花一些時間來啃一下tfidf、word2vec、doc2vec。
原创 Oracle中一條sql引發的血案(一)
血案sql如下: create table yw_wg_17 as select distinct ACC from yw_wc_cust_1715 a where a.acc not in (select distinct acc
原创 在 Toad 或 PL/SQL Developer 中使用不同版本的Oracle Client連接數據庫
在使用toad 或 PL/SQL Developer 管理、連接Oracle數據庫的時候,常要面對10-11-12等不同版本的數據庫,時常會出現客戶端版本過低或者過高導致一些功能無法順利使用,如版本過低無法連接數據庫,如無法直接使用12C
原创 ETL工具kettle與datax的對比測試案例之Oracle to Oracle
測試服務器 硬件信息: [root@catdb ~]# cat /proc/cpuinfo| grep "physical id"| sort| uniq| wc -l 2
原创 Oracle 億級表高效刪除重複數據只保留一條
一、服務器信息 1.內存 [oracle@xmldb ~]$ free -g total used free shared buffers cached Mem:
原创 oracle enterprise cloud control 12c 無法刪除target時通過emcli進行刪除
這兩天將一臺裝有ASM的數據庫註冊至OMS時,發現無法添加target,完全搜索不到。後來通過朋友在MOS上查詢到,在添加host時,listener.ora必須在$ORACLE_HOME/network/admin下。經查,該host上
原创 利用Python對Excel按列值篩選並拆分表格到多個文件
場景:集團中心下發本省數據時,並未按地市、業務拆分,現需要按地市、業務拆分並分發到地市。 本文利用Python的pandas包實現了以上場景。注:本示例代碼只實現按單列拆分,如果需要多列篩選拆分,請修改本示例中的filter_co
原创 在Toad for Oracle中使用不同版本的Oracle Client連接數據庫
在使用toad管理或連接Oracle數據庫的時候,常要面對10-11-12等不同版本的數據庫,時常會出現客戶端版本過低或者過高導致一些功能無法順利使用,如版本過低無法連接數據庫,如無法直接使用12C的client導出11g的數據等等。爲此
原创 MITK安裝教程(非中科院版7月8日更新)
MITK(非中科院版)安裝教程 MITK全名:The Medical Imaging Interaction Toolkit 。官網:http://mitk.org/。特別說明是德國版,非中科院版。使用中科院版的孩紙請忽略此文! 開場白:
原创 win10+hadoop2.9.1+hive2.2.0測試環境部署
部署安裝hadoop2.9.1後下載hive2.2.0解壓到安裝目錄,本文爲E:\post\hive\apache-hive-2.3.3-bin PS:經下載發現2.2.0以後沒有win相關的cmd命令 PS:hadoop
原创 【流水賬--oracle生產庫升級】在Centos7.0 下升級Oracle 11.2.0.1至Oracle11.2.0.4
在Centos7.0 下升級Oracle 11.2.0.1至Oracle11.2.0.4 背景:系統x86_64;Oracle software未安裝grid、asm、未搭建rac;該機器上共運行兩個instance(對應兩個databa
原创 基於Python爬取Oracle EM CC 12C上的告警信息並推送至微信企業號
本文主要介紹通過Python爬蟲腳本,將所有目標的告警信息爬下來,並推送到微信企業號應用實現單點對多目標的巡檢。籍此以減少DBA的工作量。如有不瞭解Oracle Enterprise Manager Cloud Control 12c的,