深度学习----Tensorflow再命名实体上常用的函数

原創

2020-06-24 12:39

函数	作用
tf.contrib.crf.crf_log_likelihood()	$~~~~~~~~$ 在一个条件随机场里面计算标签序列的log-likelihood，函数的目的是使用crf来计算损失，里面用到最大似然估计的优化方法，参数： inputs: 一个形状为[batch_size, max_seq_len, num_tags] 的tensor,一般使用BILSTM处理之后输出转换为他要求的形状作为CRF层的输入， tag_indices: 一个形状为[batch_size, max_seq_len] 的矩阵,其实就是真实标签， sequence_lengths: 一个形状为 [batch_size] 的向量,表示每个序列的长度， transition_params: 形状为[num_tags, num_tags] 的转移矩阵返回： log_likelihood: 标量,log-likelihood transition_params: 形状为[num_tags, num_tags] 的转移矩阵
tf.placeholder()	tf.placeholder( $~~~~~~~~~~~~~~~~~~$ dtype, $~~~~~~~~~~~~~~~~~~$ shape=None, $~~~~~~~~~~~~~~~~~~$ name=None) placeholder()函数是在神经网络构建graph的时候在模型中的占位，此时并没有把要输入的数据传入模型，它只会分配必要的内存
tf.nn.embedding_lookup	选取一个张量里面索引对应的元素（相当于索引）
tf.Variable	检测到命名冲突，系统会自己处理
tf.get_variable()	系统不会处理冲突，而会报错
tf.nn.sparse_softmax_cross_entropy_with_logits( $~~~~~~~~~~~~~~~~~~$ _sentinel=None, $~~~~~~~~~~~~~~~~~~$ labels=None, $~~~~~~~~~~~~~~~~~~$ logits=None, $~~~~~~~~~~~~~~~~~~$ nmae=None)	函数是将softmax和cross_entropy放在一起计算，对于分类问题而言，最后一般都是一个单层全连接神经网络，比如softmax分类器居多，对这个函数而言，tensorflow神经网络中是没有softmax层，而是在这个函数中进行softmax函数的计算。这里的logits通常是最后的全连接层的输出结果，labels是具体哪一类的标签，这个函数是直接使用标签数据的，而不是采用one-hot编码形式。
tf.reduce_mean	用于计算张量tensor沿着指定的数轴（tensor的某一维度）上的的平均值，主要用作降维或者计算tensor（图像）的平均值。 reduce_mean(input_tensor, $~~~~~~~~~~~~~~~~~~$ axis=None, $~~~~~~~~~~~~~~~~~~$ keep_dims=False, $~~~~~~~~~~~~~~~~~~$ name=None, $~~~~~~~~~~~~~~~~~~$ reduction_indices=None) 第一个参数input_tensor：输入的待降维的tensor; 第二个参数axis：指定的轴，如果不指定，则计算所有元素的均值; 第三个参数keep_dims：是否降维度，设置为True，输出的结果保持输入tensor的形状，设置为False，输出结果会降低维度; 第四个参数name：操作的名称; 第五个参数 reduction_indices：在以前版本中用来指定轴，已弃用
tf.global_variables_initializer()	添加节点用于初始化所有的变量(GraphKeys.VARIABLES)。返回一个初始化所有全局变量的操作（Op）。在你构建完整个模型并在会话中加载模型后，运行这个节点。
tf.local_variables_initializer()	返回一个初始化所有局部变量的操作（Op）
import argparse //导入命令行解析的库文件 parse=zargparse.ArgumentParser( $~~~~~~~~~~~$ description=“test!!” $~~~~~~~~~~~$ )	https://blog.csdn.net/yuyushikuan/article/details/79729660
os.environ[‘TF_CPP_MIN_LOG_LEVEL’] = ‘2’	设置log输出信息的，也就是程序运行时系统打印的信息。
tf.contrib.crf.viterbi_decode	通俗一点,作用就是返回最好的标签序列
tf.contrib.crf.crf_decode	在TensorFlow中解码最高得分标记序列 https://tensorflow.google.cn/api_docs/python/tf/contrib/crf/crf_decode
tf.matmul(a, b, $~~~~~~~~~~~~~~~~~~$ transpose_a=False, $~~~~~~~~~~~~~~~~~~$ transpose_b=False, $~~~~~~~~~~~~~~~~~~$ adjoint_a=False, $~~~~~~~~~~~~~~~~~~$ adjoint_b=False, $~~~~~~~~~~~~~~~~~~$ a_is_sparse=False, $~~~~~~~~~~~~~~~~~~$ b_is_sparse=False, $~~~~~~~~~~~~~~~~~~$ name=None)	a: 一个类型为 float16, float32, float64, int32, complex64, complex128 且张量秩 > 1 的张量。 b: 一个类型跟张量a相同的张量。 transpose_a: 如果为真, a则在进行乘法计算前进行转置。 transpose_b: 如果为真, b则在进行乘法计算前进行转置。 adjoint_a: 如果为真, a则在进行乘法计算前进行共轭和转置。 adjoint_b: 如果为真, b则在进行乘法计算前进行共轭和转置。 a_is_sparse: 如果为真, a会被处理为稀疏矩阵。 b_is_sparse: 如果为真, b会被处理为稀疏矩阵。 name: 操作的名字（可选参数）
tf.multiply（x, y, name=None）	两个矩阵中对应元素各自相乘
tf.variable_scope(“conv1”)	指定变量作用域
tf.nn.bidirectional_dynamic_rnn()	cell_fw, # 前向RNN cell_bw, # 后向RNN inputs, # 输入 sequence_length=None,# 输入序列的实际长度（可选，默认为输入序列的最大长度） initial_state_fw=None, # 前向的初始化状态（可选） initial_state_bw=None, # 后向的初始化状态（可选） dtype=None, # 初始化和输出的数据类型（可选） parallel_iterations=None, swap_memory=False, time_major=False, # 决定了输入输出tensor的格式：如果为true, 向量的形状必须为 `[max_time, batch_size, depth]`. # 如果为false, tensor的形状必须为`[batch_size, max_time, depth]`. scope=None 返回的是元组（outputs，output_states）

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

原来Stable Diffusion是这样工作的

stable diffusion是一種潛在擴散模型，可以從文本生成人工智能圖像。爲什麼叫做潛在擴散模型呢？這是因爲與在高維圖像空間中操作不同，它首先將圖像壓縮到潛在空間中，然後再進行操作。在這篇文章中，我們將深入瞭解它到底是如何工作的,還

2024-06-06 21:38:48

大模型在推荐系统中的精准推荐策略与实践

引言推薦系統在現代互聯網應用中佔據了極其重要的位置。無論是電商平臺、社交媒體、音樂和視頻流媒體服務，還是新聞和內容推薦系統，推薦系統都在提高用戶體驗和平臺收益方面發揮着關鍵作用。近年來，隨着人工智能和機器學習技術的迅猛發展，大模型（如G

2024-06-06 23:55:10

BCS2024｜Baidu Comate：以研发提效为驱动实现“安全左移”

2024年6月5日，以“AI驅動安全”爲主題的2024全球數字經濟大會數字安全高層論壇暨北京網絡安全大會戰略峯會（簡稱“BCS大會”）在北京國家會議中心開幕。 BCS2024｜“互聯網創新發展”論壇百度研發安全負責人陳長林出席互聯網創

2024-06-08 09:41:40

低代码：加速企业数字化转型的利器

隨着企業數字化轉型步伐的加快，低代碼開發平臺迅速成爲市場的焦點。**憑藉其能簡化開發流程、縮短交付時間和降低成本等優勢，**低代碼已經贏得了企業和開發人員的廣泛認可，已成爲推動企業數字化轉型、提高企業創新效率、競爭力的關鍵工具。本文將詳細介

2024-06-07 21:18:49

企业实施数字化转型有哪些方面？

本人研究企業數字化轉型10餘年，爲企業軟件選型、數字化提供諮詢服務！目前重點研究低代碼數字化轉型玩法，力爭爲各行各業探索出一條最具性價比的數字化方式。關於“企業數字化轉型包括哪些方面”這個問題，咱先來看個例子哈~ 比如說某製造企業通過數

2024-06-06 21:27:46

首批！Zilliz 获得亚马逊云科技生成式 AI 合作伙伴能力认证

Zilliz 正式宣佈通過亞馬遜雲科技生成式 AI 能力認證！這一認證不僅肯定了 Zilliz 在人工智能和非結構化數據領域的卓越能力，也標誌着 Zilliz 在推動 AI 技術創新和應用的道路上邁出了重要一步。亞馬遜雲科技生

2024-06-06 14:16:04

度安讲 * 第二期「安全左移·业务护航」技术沙龙成功举办

當下，“安全左移”作爲落地DevSecOps的重要實踐之一，已在業界達成共識。DevSecOps作爲一種集開發、安全、運維於一體的軟件開發和運營模式，強調在敏捷交付下，“安全”在軟件開發生命週期的全覆蓋貫穿和核心位置。所謂“安全左移”，與

2024-06-03 21:42:25

向量数据库引领 AI 创新——Zilliz 亮相 2024 亚马逊云科技中国峰会

2024年5月29日，亞馬遜雲科技中國峯會在上海召開，此次峯會聚集了來自全球各地的科技領袖、行業專家和創新企業，探討雲計算、大數據、人工智能等前沿技術的發展趨勢和應用場景。作爲領先的向量數據庫技術公司，Zilliz 在本次峯會上展示了最新的

2024-05-30 21:25:17

大模型安全｜RAG精确应对大模型敏感问题知识幻觉难题

一、引言在大模型的實際應用落地過程中，會遇到所謂的幻覺（Hallucination）問題。對於語言模型而言，當生成的文本語法正確流暢，但與原文不符（Faithfulness）或事實不符（Factualness）時，模型便出現了幻覺的問題。

2024-06-07 21:41:51

技术实践 | RAG精确应对大模型敏感问题知识幻觉难题

一、引言在大模型的實際應用落地過程中，會遇到所謂的幻覺（Hallucination）問題。對於語言模型而言，當生成的文本語法正確流暢，但與原文不符（Faithfulness）或事實不符（Factualness）時，模型便出現

2024-06-07 21:41:50

618网购节，电商能挡住恶意网络爬虫的攻击吗？

2023年，杭州中院審結了兩起涉及“搬店軟件”的不正當競爭案件。本案的原告是國內某大型知名電子商務平臺的運營主體，而被告則是開發了一款名爲“某搬家快速商品上貨批量發佈”的複製軟件，被控非法獲取平臺商品信息並在其他服務市場銷售。根據原告的訴

2024-06-07 00:14:57

什么是LLM大模型训练，详解Transformer结构模型

本文分享自華爲雲社區《LLM 大模型學習必知必會系列(四)：LLM訓練理論篇以及Transformer結構模型詳解》，作者：汀丶。 1.模型/訓練/推理知識介紹深度學習領域所謂的“模型”，是一個複雜的數學公式構成的計算步驟。爲了便於理解

2024-06-04 11:09:34

Prompt Tuning：大模型微调实战

隨着深度學習技術的不斷髮展，大模型在各種任務中取得了顯著的成果。然而，大模型的訓練需要大量的數據和算力，導致在實際應用中受到限制。爲了解決這個問題，研究者們提出了微調的方法，即使用預訓練模型在少量數據上進行訓練，使其適應特定的任務。在Pr

2024-06-03 12:14:42

走进京东“卓越研效架构师”首期研习营圆满收官

五月的北京，春深半夏，花開滿城。由全國雲計算技術行業產教融合共同體牽頭，攜手工業和信息化部電子第五研究所、E³CI軟件研發效能度量工作委員會以及京東雲共同主辦的“走進京東——卓越研效架構師”研習營，於5月17-18日和24-26日在北京京東

2024-05-31 23:55:49

儿童节变身小小音乐家*用ModelArts制作一张AIGC音乐专辑

本文分享自華爲雲社區《兒童節變身小小音樂家*用ModelArts製作一張AIGC音樂專輯》*作者* 華爲雲社區精選。兒童節*如何給小朋友準備一份特別的禮物* 這份AIGC音樂專輯製作攻略一定要收下一段文字靈感就能編織出一曲悠揚悅耳的旋

2024-05-31 11:04:39

24小時熱門文章

最新文章

最新評論文章