深度學習----Tensorflow再命名實體上常用的函數

原創

2020-06-24 12:39

函數	作用
tf.contrib.crf.crf_log_likelihood()	$~~~~~~~~$ 在一個條件隨機場裏面計算標籤序列的log-likelihood，函數的目的是使用crf來計算損失，裏面用到最大似然估計的優化方法，參數： inputs: 一個形狀爲[batch_size, max_seq_len, num_tags] 的tensor,一般使用BILSTM處理之後輸出轉換爲他要求的形狀作爲CRF層的輸入， tag_indices: 一個形狀爲[batch_size, max_seq_len] 的矩陣,其實就是真實標籤， sequence_lengths: 一個形狀爲 [batch_size] 的向量,表示每個序列的長度， transition_params: 形狀爲[num_tags, num_tags] 的轉移矩陣返回： log_likelihood: 標量,log-likelihood transition_params: 形狀爲[num_tags, num_tags] 的轉移矩陣
tf.placeholder()	tf.placeholder( $~~~~~~~~~~~~~~~~~~$ dtype, $~~~~~~~~~~~~~~~~~~$ shape=None, $~~~~~~~~~~~~~~~~~~$ name=None) placeholder()函數是在神經網絡構建graph的時候在模型中的佔位，此時並沒有把要輸入的數據傳入模型，它只會分配必要的內存
tf.nn.embedding_lookup	選取一個張量裏面索引對應的元素（相當於索引）
tf.Variable	檢測到命名衝突，系統會自己處理
tf.get_variable()	系統不會處理衝突，而會報錯
tf.nn.sparse_softmax_cross_entropy_with_logits( $~~~~~~~~~~~~~~~~~~$ _sentinel=None, $~~~~~~~~~~~~~~~~~~$ labels=None, $~~~~~~~~~~~~~~~~~~$ logits=None, $~~~~~~~~~~~~~~~~~~$ nmae=None)	函數是將softmax和cross_entropy放在一起計算，對於分類問題而言，最後一般都是一個單層全連接神經網絡，比如softmax分類器居多，對這個函數而言，tensorflow神經網絡中是沒有softmax層，而是在這個函數中進行softmax函數的計算。這裏的logits通常是最後的全連接層的輸出結果，labels是具體哪一類的標籤，這個函數是直接使用標籤數據的，而不是採用one-hot編碼形式。
tf.reduce_mean	用於計算張量tensor沿着指定的數軸（tensor的某一維度）上的的平均值，主要用作降維或者計算tensor（圖像）的平均值。 reduce_mean(input_tensor, $~~~~~~~~~~~~~~~~~~$ axis=None, $~~~~~~~~~~~~~~~~~~$ keep_dims=False, $~~~~~~~~~~~~~~~~~~$ name=None, $~~~~~~~~~~~~~~~~~~$ reduction_indices=None) 第一個參數input_tensor：輸入的待降維的tensor; 第二個參數axis：指定的軸，如果不指定，則計算所有元素的均值; 第三個參數keep_dims：是否降維度，設置爲True，輸出的結果保持輸入tensor的形狀，設置爲False，輸出結果會降低維度; 第四個參數name：操作的名稱; 第五個參數 reduction_indices：在以前版本中用來指定軸，已棄用
tf.global_variables_initializer()	添加節點用於初始化所有的變量(GraphKeys.VARIABLES)。返回一個初始化所有全局變量的操作（Op）。在你構建完整個模型並在會話中加載模型後，運行這個節點。
tf.local_variables_initializer()	返回一個初始化所有局部變量的操作（Op）
import argparse //導入命令行解析的庫文件 parse=zargparse.ArgumentParser( $~~~~~~~~~~~$ description=“test!!” $~~~~~~~~~~~$ )	https://blog.csdn.net/yuyushikuan/article/details/79729660
os.environ[‘TF_CPP_MIN_LOG_LEVEL’] = ‘2’	設置log輸出信息的，也就是程序運行時系統打印的信息。
tf.contrib.crf.viterbi_decode	通俗一點,作用就是返回最好的標籤序列
tf.contrib.crf.crf_decode	在TensorFlow中解碼最高得分標記序列 https://tensorflow.google.cn/api_docs/python/tf/contrib/crf/crf_decode
tf.matmul(a, b, $~~~~~~~~~~~~~~~~~~$ transpose_a=False, $~~~~~~~~~~~~~~~~~~$ transpose_b=False, $~~~~~~~~~~~~~~~~~~$ adjoint_a=False, $~~~~~~~~~~~~~~~~~~$ adjoint_b=False, $~~~~~~~~~~~~~~~~~~$ a_is_sparse=False, $~~~~~~~~~~~~~~~~~~$ b_is_sparse=False, $~~~~~~~~~~~~~~~~~~$ name=None)	a: 一個類型爲 float16, float32, float64, int32, complex64, complex128 且張量秩 > 1 的張量。 b: 一個類型跟張量a相同的張量。 transpose_a: 如果爲真, a則在進行乘法計算前進行轉置。 transpose_b: 如果爲真, b則在進行乘法計算前進行轉置。 adjoint_a: 如果爲真, a則在進行乘法計算前進行共軛和轉置。 adjoint_b: 如果爲真, b則在進行乘法計算前進行共軛和轉置。 a_is_sparse: 如果爲真, a會被處理爲稀疏矩陣。 b_is_sparse: 如果爲真, b會被處理爲稀疏矩陣。 name: 操作的名字（可選參數）
tf.multiply（x, y, name=None）	兩個矩陣中對應元素各自相乘
tf.variable_scope(“conv1”)	指定變量作用域
tf.nn.bidirectional_dynamic_rnn()	cell_fw, # 前向RNN cell_bw, # 後向RNN inputs, # 輸入 sequence_length=None,# 輸入序列的實際長度（可選，默認爲輸入序列的最大長度） initial_state_fw=None, # 前向的初始化狀態（可選） initial_state_bw=None, # 後向的初始化狀態（可選） dtype=None, # 初始化和輸出的數據類型（可選） parallel_iterations=None, swap_memory=False, time_major=False, # 決定了輸入輸出tensor的格式：如果爲true, 向量的形狀必須爲 `[max_time, batch_size, depth]`. # 如果爲false, tensor的形狀必須爲`[batch_size, max_time, depth]`. scope=None 返回的是元組（outputs，output_states）

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

攻擊者正在利用AI，對保險公司發起大規模欺詐

保險欺詐一直是保險行業面臨的重要挑戰之一，尤其隨着技術的進步，欺詐者也在不斷更新其手段，利用AI技術，包括生成式模型、機器學習和數據分析工具等欺騙保險公司，而AI技術的應用正成爲他們的新工具，使其犯罪行爲更加隱蔽和複雜，挑戰保險行業的防欺詐

2024-05-10 00:55:17

我宣佈，這是我找到的史上AI最全論文體系！

在碎片化閱讀充斥眼球的時代，越來越少的人會去關注每篇論文背後的探索和思考。搞AI，不少人都進入一個誤區，那就是隻鑽研自己的代碼是否精進，而沒有注意提升自己的閱讀能力。實際上，一個專業的學術研究員或者AI研究員可能需要花費幾百個小

2024-05-13 21:33:50

舌尖上的AI：人工智能技術正在被“端上”餐桌

來源 | 人民數字FINTECH 責編 | 晉兆雨頭圖 | CSDN 下載自視覺中國 #人工智能技術正在被“端上”餐桌四方食事，不過一碗人間煙火。人工智能作爲一門新的技術科學，正在被人間煙火氣“端”上餐桌。人工智能“洗手”

2024-05-13 21:17:25

LoRA微調語言大模型的實用技巧與實踐

隨着人工智能技術的不斷髮展，大型語言模型在各個領域的應用越來越廣泛。然而，大型語言模型的訓練成本高昂，且難以適應不同領域的具體需求。爲了解決這個問題，LoRA微調技術應運而生。本文將介紹LoRA微調語言大模型的實用技巧，幫助讀者更好地應用這

2024-05-09 12:48:45

AI繪圖新選擇：Fooocus工具發佈，小顯存助力大模型運行

隨着人工智能技術的飛速發展，AI繪圖工具已經成爲了衆多創作者們的得力助手。它們能夠基於深度學習算法，快速生成高質量的圖像，爲設計、藝術等領域注入了新的活力。然而，傳統的AI繪圖工具往往對硬件要求較高，使得許多擁有較低配置設備的用戶望而卻步。

2024-05-07 23:30:10

GLM國產大模型訓練加速：高效性能與成本優化的實踐

隨着人工智能技術的不斷進步，大模型的訓練成爲了推動深度學習領域發展的重要力量。然而，傳統的訓練方式往往面臨着性能瓶頸和高昂的成本問題，這使得許多研究者和開發者望而卻步。爲了解決這一難題，我們探索了使用OneFlow框架對GLM國產大模型進行

2024-05-07 23:30:09

Kimi大模型，加入微信了

哈哈哈，喜大普奔！前段時間發現微信公衆號被開通留言，最近又發現 Kimi大模型現在可以接入微信公衆號了！這意味着我們能夠更加便捷地享受到Kimi智能助手的服務，還代表着我們有了一個免費且好用且穩定且無需翻牆的 AI助

2024-05-13 23:51:55

內嵌專業接口的RISC-V架構MCU，誰家有？

前一陣，蘋果推出了M1處理器，相比關注具體指標，業內其實更關心M1推出後會引領產業往哪個方向發展，不少人的結論是RISC-V會成爲未來芯片發展的熱點，因爲RISC-V有很多巧妙的方法可以提高性能。計算機界泰斗David Patterso

2024-05-13 23:26:39

免費報名|Zabbix受邀出席上海開源技術沙龍，探討開源軟件賦能新質生產力

大家好！5月25日我們將舉辦今年第三期上海開源技術沙龍活動。本次的主題是——開源軟件賦能新質生產力。在上海開源信息技術協會 (SHOpen) 的指導下，隨着活動的持續開展，上海開源技術沙龍獲得了越來越多開發者的關注與

2024-05-13 22:34:43

海外市場成 ISV 新掘金地？生成式 AI 如何加速業務創新實踐？Zilliz 有話說

期望瞭解 Zilliz 最新動態？想要與 Zilliz 線下探討 AI 時代向量數據庫的全球化佈局思考及典型實踐？機會來啦！5 月 10 日，Zilliz 將閃現亞馬遜雲科技的兩場活動現場（蘇州、西安），與大家共話行業發展與未來，歡迎報名

2024-05-08 21:21:54

程序員不存在了……嗎？

近期，在談及人工智能的發展速度時，馬斯克預計，按照當前的技術進步速度，到2030年人工智能的智力可能超越人類，這項技術甚至有可能終結人類。那麼，人工智能的強大究竟對人類將帶來更多機遇還是危機呢？今天，我們特邀了《深入理解 FFmpeg

2024-05-08 11:12:06

大模型微調方法總結：LoRA, Adapter, Prefix-tuning, P-tuning, Prompt-tuning

隨着自然語言處理（NLP）技術的不斷髮展，大模型微調（finetune）方法成爲了提高模型性能的關鍵手段。本文將對LoRA、Adapter、Prefix-tuning、P-tuning和Prompt-tuning等主流微調方法進行總結，幫助

2024-05-09 12:48:44

探索大語言模型：理解Self Attention| 京東物流技術團隊

一、背景知識在ChatGPT引發全球關注之後，學習和運用大型語言模型迅速成爲了熱門趨勢。作爲程序員，我們不僅要理解其表象，更要探究其背後的原理。究竟是什麼使得ChatGPT能夠實現如此卓越的問答性能？自注意力機制的巧妙融入無疑是關鍵因素

2024-05-14 23:57:26

GPU 硬件指標說明

流處理器：也叫渲染管、着色器。畫面都是由一個又一個像素點組成的，而流處理器就負責這些像素點的渲染工作； RT核心：光追核心，用作於光線追蹤效果； CUDA 核心和Tensor 核心：CUDA Core和Tensor Core，爲G

2024-05-13 22:35:43

AIGC在京東廣告創意的技術應用

一、前言電商廣告圖片不僅能夠抓住消費者的眼球，還可以傳遞品牌核心價值和故事，建立起與消費者之間的情感聯繫。然而現有的廣告圖片大多依賴人工製作，存在效率和成本的限制。儘管最近AIGC技術取得了卓越的進展，但其在廣告圖片的應

京東雲開發者

2024-05-08 23:24:18

24小時熱門文章

最新文章

最新評論文章