erlang的汉字字符串和二进制的相互转换，并还原成汉字打印

原創

2021-04-08 21:33

测试：

1> Hanzi = <<”汉字”/utf8>>.
<<230,177,137,229,173,151>>
2> io:format(“~ts”,[Hanzi]).
汉字ok
3> io:format(“~w”,[Hanzi]).
<<230,177,137,229,173,151>>ok
22> unicode:characters_to_binary(“中国”).
<<228,184,173,229,155,189>>

结论：

中文字符，在Erlang的存储方式，可以是List，也可以是Binary。

如果以List方式存储，即将中文字符，转为Unicode编码（长整数格式）；

如果以Binary方式存储，即将中文字符，转为UTF-8编码。

至于Unicode与UTF-8的区别，简单来说，Unicode是一个码表，UTF-8是Unicode编码的一种表示方法。具体的区别，大家可问下谷歌或度娘。

例子：

start() ->
Str = “中国”,
io:format(“Unicode list is: ~p~n”, [Str]),
Bin = unicode:characters_to_binary(Str),
io:format(“Unicode binary is: ~p~n”, [Bin]),
Str1 = unicode:characters_to_list(Bin, utf8),
io:format(“utf8 binary to list is: ~p~n”, [Str1]).

输出结果：

Eshell V6.4 (abort with ^G)
([email protected])1> Unicode list is: [20013,22269]
([email protected])1> Unicode binary is: <<228,184,173,229,155,189>>
([email protected])1> utf8 binary to list is: [20013,22269]
([email protected])1>

其中用到了unicode库函数，如果使用普通的erlang:list_to_binary或erlang:binary_to_list，会有编码问题。

在开发过程中，使用的一些第三方库，对中文支持或多或少都有些问题，各位按照此规则调试，可以解决。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

【解决】Windows上erlang/elixir的Hosts文件解析错误问题

如果您遇到以下錯誤 args: ["c:/WINDOWS/System32/drivers/etc/hosts",1] format: "inet_parse:~p:~p: erroneous line, SKIPPED~n" labe

2024-02-27 00:21:18

centos8 安装rabbitmq

安裝erlang 由於 rabbitmq 是基於 erlang 語言開發的，所以必須先安裝 erlang 。安裝依賴 yum -y install gcc glibc-devel make ncurses-devel opens

2023-03-20 23:21:38

GPS终端16进制经纬度相互转换

緯度佔用4個字節，表示定位數據的緯度值。數值範圍0至162000000，表示0度到90度的範圍，單位：1/500秒。轉換方法如下： 1、把GPS模塊輸出的經緯度值轉化成以分爲單位的小數； 2、把轉化後的小數乘以30000，把相乘的

2023-03-15 00:30:31

erlang: function called with real 'fun' should be transformed with parse_transform?

問題描述： {badarg,{ets,fun2ms,[function,called,with,real,'fun',should,be,transformed,with,parse_transform,'or',called,with

2023-03-06 23:44:16

如何将新的 Erlang 应用程序添加到 Rebar3 umbrella 项目？

我在文檔中找不到它（或者，更可能的是，我錯過了它），所以我認爲這些是步驟：將現有的 Erlang 應用程序（或創建一個新應用程序rebar3 new app）複製到<umbrella_root>/apps/（或<umbrella_ro

2023-02-16 23:50:38

这些编程语言值得学习

值得學習的編程語言多種多樣，前端、後端乃至框架選項更是多達數百種。作爲開發者，C/C++、Java、Python、Perl、Ruby 等，這些一定是你再熟悉不過的。值得學習的編程語言多種多樣，前端、後端乃至框架選項更是多達數

2022-04-30 12:17:25

排行榜功能的思考点

%% 算法設計需要考慮的點 %% 能夠解決業務問題，高效(大流量應用)穩定(穩定體現在哪些方面呢？不會因爲數據量太大，導致效率變差) %% 確定算法的選型和數據結構的選型 %% 全面分析任務對數據處理和計算的基本操作，根據基本操作

2022-04-30 06:30:29

关于排行榜算法的处理

使用場景玩家戰力排行榜，可以實時的同步排行榜的信息，排行榜的數量設定爲200條，玩家戰力變化，可以及時在排行榜中體現出來，相應的排名也發生變化,並且可以不用提前進行數據的排他性處理；使用說明 erlang本身的列表排序採用歸併排序

2022-04-30 06:30:26

Erlang 代码热更机制

步驟 1.編譯代碼 2.code:purge模塊 1.當前的會保留兩個版本，如果第三次編譯的時候，會清理最舊的版本，特別注意，如果使用了receive的進程，沒有設置after參數，可能導致當前進程被關閉 2.soft_purge模塊

2021-12-26 21:32:30

Erlang细节设计

隨機數生成 1.設置隨機種子 random:seed(),獲取隨機值 2.random:uniform() %% 代碼設計 rand(Min, Max) -> case get("rand_seed") of

2021-12-25 21:48:24

Erlang 服务器万人同服排行榜设计优化

測試數據結論：可以看出使用計數排序，可以極大的提高排序的效率，相比全排序提高3-4倍的效率測試環境 erlang23.3 性能優缺點分析計數排序的好處是當數據變化時，只需要對增加的分片進行排序，減少排序量性能弱點：分片保

2021-12-25 21:48:23

Erlang GUI常用命令

xc(Module) :熱更代碼 inet:i():查看當前的網絡連接狀態 observer:start():啓動管理器 im():打開代碼調試 rr(xxx.hrl):導入頭文件 -crashdump_viewer:start(). ：

2021-12-25 21:48:23

查找内存泄露的一次实战

通過top查看佔用做多的beam進程通過進程id3462查看進程啓動信息命令：ps -aux|grep beam 找到啓動文件，節點名和cookie信息 remsh 對應的節點 erl -name [email protected].

2021-12-25 21:48:22

Erlang 常见问题汇总

節點的進程莫名的斷開了，如何排查 1.是否有錯誤信息 2.查看terminate信息，如何沒有檢查是否沒有設置trap_exit,true 3.對handle_call,handle_cast,handle_info增加try_cat

2021-12-25 21:48:22

Erlang 编码规范

數據的修改統一管理，不要分散儘量使用tuple不要使用list ets的匹配使用match/match_object，而不是使用select ets遍歷使用ets_match_object的迭代遍歷主要++操作，是左邊遍歷，最好將小列

2021-12-25 21:48:22

24小時熱門文章

最新文章

最新評論文章