linux 上的xml痛苦之处

原創

2020-02-26 05:10

如果选用utf8编码的系统在linux上面开发，xml类库采用libxml，那么不说也罢，一切都显得顺气自然。尤其libxml在xml处理效率方面的良好表现自然成了首选。

但如果系统架构编码支持已开始就选定了gb2312，那么噩耗将会接踵而来。当然所谓的噩耗，并非说libxml就不能解析gb2312编码的xml数据。其实无论采用linux系统函数iconv或者libxml的系统自带函数都可以正常读入gb2312编码的xml数据，唯一的区别就是使用编码转化带来的效率问题以及其他问题。尤其是通信服务端解析来自客户端的xml数据，在高并发的情况下，往往并非select,poll,epoll的关键字会如何造成数据处理的堆积，很大程度上取决于后台业务处理的效率。xml数据编码转化甚至如同蝴蝶效应一样可能给整个系统带来效率和稳定性上的损耗。

好在libxml通过不停的完善之后，已经能够支持gb2312编码的xml数据输入处理了，但是却又给大家开了一个天大的玩笑。似乎libxml解析xml后的结果，输出依然是utf8等类库内核编码。呵呵，这就如同某个男人进了一间黑屋子穿了一件帅气的衣服出来后却变成了女的。还是又不得不用iconv来进行处理。

呵呵，苦笑，本想去编译libxml源码，后来发现其内核编码支持的非常有限，apache组织的xml解析库也存在libxml的问题，无奈之下，选择了小巧灵活的tinyxml。编码也简单多了，至少少了许多libxml惊心动魄的内存管理，唯一的付出，就是需要一些算法进行xml的特出的业务处理。

无奈，这个世界就这样，没有完美的东西。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

用DolphinScheduler轻松实现Flume数据采集任务自动化！

轉載自天地風雷水火山澤目的因爲我們的數倉數據源是Kafka，離線數倉需要用Flume採集Kafka中的數據到HDFS中。在實際項目中，我們不可能一直在Xshell中啓動Flume任務，一是因爲項目的Flume任務很多，二是一旦Xsh

2024-04-24 21:18:09

告别手动调度，海豚调度器 3.1.x 集群部署让你轻松管理多机！

轉載自第一片心意 1 前言由於海豚調度器官網的集羣部署文檔寫的較亂，安裝過程中需要跳轉到很多地方進行操作，所以自己總結了一篇可以直接跟着從頭到尾進行操作的文檔，以方便後續的部署、升級、新增節點、減少節點的相關操作。 2. 提前準備 2.

2024-04-23 21:18:20

iTOP-3588S开发板瑞芯微RK3588S处理器主频2.4GHz算力6T

核心板參數：尺寸： 55mm*45mm 連接器高度： 1.5mm CPU： RK3588S 主頻：四核 Cortex-A55, Quad-core ARM Cortex-A76,Neon and FPU, 2.4GHZ 內存：

2024-04-22 22:54:04

Create 2024 分论坛：百度大模型安全解决方案护航开发者一起创造未来

4月16日，百度Create AI開發者大會在深圳國際會展中心（寶安）舉行，大會以“創造未來”爲主題，匯聚了當前科技和產業革命中的開發者先鋒力量。自去年3月16日發佈知識增強大語言模型文心一言以來，百度不斷推動文心大模型的升級迭代，每一次版

2024-04-19 21:33:25

Qt/C++音视频开发70-无感切换通道/无缝切换播放视频/多通道流畅切换/不同视频打开无缝切换

一、前言之前就寫過這個方案，當時做的是ffmpeg內核版本，由於ffmpeg內核解析都是代碼實現，所以無縫切換非常完美，看不到絲毫的中間切換過程，看起來就像是在一個通道畫面中。其實這種切換隻能說是取巧辦法，最佳的辦法應該是公用一個open

2024-04-18 10:40:53

RK3568驱动指南｜第二篇字符设备基础-第16章一个驱动兼容不同设备实验

瑞芯微RK3568芯片是一款定位中高端的通用型SOC，採用22nm製程工藝，搭載一顆四核Cortex-A55處理器和Mali G52 2EE 圖形處理器。RK3568 支持4K 解碼和 1080P 編碼，支持SATA/PCIE/USB3.0

2024-04-17 22:54:26

Linux 安装达梦数据库

1.參考官網地址： https://eco.dameng.com/document/dm/zh-cn/start/install-dm-linux-prepare.html 2.圖形化可以不安裝。 3.安裝過程中修改端口等配置初始登錄：

2024-04-17 22:50:09

KCD上海站免费报名丨赏玉兰花开，畅聊云原生技术

Kubernetes Community Days（KCD）上海2024 現已開放報名通道！這是一場大型的面向開發者的技術交流會在現場，你可以與各路技術社區達人交流 battle 共同探討雲原生技術的最新進展現場感受AI/操作

2024-04-17 22:13:22

「Qt Widget中文示例指南」如何实现行编辑功能

Qt 是目前最先進、最完整的跨平臺C++開發工具。它不僅完全實現了一次編寫，所有平臺無差別運行，更提供了幾乎所有開發過程中需要用到的工具。如今，Qt已被運用於超過70個行業、數千家企業，支持數百萬設備及應用。 Line Edits（行編輯）

2024-04-17 11:37:05

MQTT 5.0 报文解析 05：DISCONNECT

歡迎閱讀 MQTT 5.0 報文系列的第五篇文章。在上一篇中，我們已經介紹了 MQTT 5.0 的 PINGREQ 和 PINGRESP 報文。現在，我們將介紹下一個控制報文：DISCONNECT。在 MQTT 中，客戶端和服務端可以在

2024-04-16 21:56:02

Centos清空历史命令

在Linux（centos）中，在終端中運行的所有命令都會存儲在主目錄中名爲 .bash_history 的文本文件中。這個時候可以通過使用 history 命令來顯示系統自您啓動會話以來輸入的所有命令的列表。出於某種原因，有時候想要從Li

2024-04-16 21:52:56

从零开始学架构V2-初识架构设计-1

一、架構設計的主要目的爲了解決軟件系統複雜度帶來的問題二、複雜性來源軟件的架構設計是一個非常複雜的過程；基於業務&技術現狀、公司成本、團隊規模、團隊技術能力、近三年業務發展規模預測、技術發展趨勢等條件篩選出合適的技術、編寫多種架構設計

2024-04-25 23:56:25

kafka更新元数据失败问题研究

現象 kafka-admin-client-thread線程打印: AdminMetadataManager.updateField Metadata update failed: org.apache.kafka.common.error

2024-04-24 23:18:37

得物 ZooKeeper SLA 也可以 99.99%丨最佳实践

作者：Bruce 背景今天分享的案例來自於得物技術團隊應用 MSE-ZooKeeper 過程中的最佳實踐。原文得物 ZooKeeper SLA 也可以 99.99% ｜得物技術。 ZooKeeper（ZK）是一個誕生於 2007 年的分

2024-04-22 21:12:04

tp5命令行报 [BadFunctionCallException] not support: redis

tp5命令行報 [BadFunctionCallException] not support: redis 芝麻開門2015 於 2018-09-30 18:29:49 發佈閱讀量1.3w 收藏 1 點贊數分類專欄： php 版權 p

2024-04-17 00:27:13

24小時熱門文章

最新文章

最新評論文章