原创 煉丹記之實戰LSTM搭爐煉丹

寫在前面:爐是垃圾爐,丹是垃圾丹(結的丹中age最高只有0.369,還沒我用catboost刷出來的高) 騰訊2020廣告算法大賽地址:https://algo.qq.com/ 前一篇博文寫了如何構造embedding vector,並且

原创 煉丹記之在非典型NLP領域使用word2vec構造特徵

最近各種競賽上對時序數據進行embeding很火、效果很好,比如數字中國2020的智慧海海建設中rank1的分享,譬如2020騰訊廣告大賽。 爲了上分,NLP小白一枚不得不花一些時間來啃一下tfidf、word2vec、doc2vec。

原创 Oracle中一條sql引發的血案(一)

血案sql如下: create table yw_wg_17 as select distinct ACC from yw_wc_cust_1715 a where a.acc not in (select distinct acc

原创 在 Toad 或 PL/SQL Developer 中使用不同版本的Oracle Client連接數據庫

在使用toad 或 PL/SQL Developer 管理、連接Oracle數據庫的時候,常要面對10-11-12等不同版本的數據庫,時常會出現客戶端版本過低或者過高導致一些功能無法順利使用,如版本過低無法連接數據庫,如無法直接使用12C

原创 ETL工具kettle與datax的對比測試案例之Oracle to Oracle

測試服務器 硬件信息: [root@catdb ~]# cat /proc/cpuinfo| grep "physical id"| sort| uniq| wc -l 2

原创 Oracle 億級表高效刪除重複數據只保留一條

一、服務器信息 1.內存 [oracle@xmldb ~]$ free -g total used free shared buffers cached Mem:

原创 oracle enterprise cloud control 12c 無法刪除target時通過emcli進行刪除

這兩天將一臺裝有ASM的數據庫註冊至OMS時,發現無法添加target,完全搜索不到。後來通過朋友在MOS上查詢到,在添加host時,listener.ora必須在$ORACLE_HOME/network/admin下。經查,該host上

原创 利用Python對Excel按列值篩選並拆分表格到多個文件

    場景:集團中心下發本省數據時,並未按地市、業務拆分,現需要按地市、業務拆分並分發到地市。 本文利用Python的pandas包實現了以上場景。注:本示例代碼只實現按單列拆分,如果需要多列篩選拆分,請修改本示例中的filter_co

原创 在Toad for Oracle中使用不同版本的Oracle Client連接數據庫

在使用toad管理或連接Oracle數據庫的時候,常要面對10-11-12等不同版本的數據庫,時常會出現客戶端版本過低或者過高導致一些功能無法順利使用,如版本過低無法連接數據庫,如無法直接使用12C的client導出11g的數據等等。爲此

原创 MITK安裝教程(非中科院版7月8日更新)

MITK(非中科院版)安裝教程 MITK全名:The Medical Imaging Interaction Toolkit 。官網:http://mitk.org/。特別說明是德國版,非中科院版。使用中科院版的孩紙請忽略此文! 開場白:

原创 win10+hadoop2.9.1+hive2.2.0測試環境部署

部署安裝hadoop2.9.1後下載hive2.2.0解壓到安裝目錄,本文爲E:\post\hive\apache-hive-2.3.3-bin     PS:經下載發現2.2.0以後沒有win相關的cmd命令     PS:hadoop

原创 【流水賬--oracle生產庫升級】在Centos7.0 下升級Oracle 11.2.0.1至Oracle11.2.0.4

在Centos7.0 下升級Oracle 11.2.0.1至Oracle11.2.0.4 背景:系統x86_64;Oracle software未安裝grid、asm、未搭建rac;該機器上共運行兩個instance(對應兩個databa

原创 基於Python爬取Oracle EM CC 12C上的告警信息並推送至微信企業號

本文主要介紹通過Python爬蟲腳本,將所有目標的告警信息爬下來,並推送到微信企業號應用實現單點對多目標的巡檢。籍此以減少DBA的工作量。如有不瞭解Oracle Enterprise Manager Cloud Control 12c的,