C++生成格式化的標準字符串實例代碼

這篇文章主要給大家介紹了關於C++生成格式化的標準字符串的相關資料,文中通過示例代碼介紹的非常詳細,對大家學習或者使用C++具有一定的參考學習價值,需要的朋友們下面來一起學習學習吧

兩種格式化字符串方法

衆所周知,C++的std::string功能殘缺,各種功能都沒有,比如格式化字符串功能。

在python3中,支持兩種格式化字符串的方法,一種是C風格,格式化的部分用%開頭,%後面的對應具體類型(比如%s對應字符串%d對應整型),另一種則是類型無關的風格,{0}對應第1個參數,{1}對應第2個參數。

>>> "{0}'s age is {1}".format("赤紅", 11)
"赤紅's age is 11"
>>> "%s's age is %d" % ("赤紅", 11)
"赤紅's age is 11"

而在C++中則只能借用C函數,用snprintf來格式化一片緩衝區

#define BUFFSIZE 512
 char buf[BUFFSIZE];
 snprintf(buf, BUFFSIZE, "%s's age is %d\n", "赤紅", 11);

亦或者用類型無關的流運算符

 std::ostringstream os;
 os << "赤紅" << "'s age is " << 11 << "\n";
 std::string s = os.str();

暫且不談效率問題,這種用<<拼接多個不同類型對象的做法代碼量較大,而且在控制具體輸出格式時更爲麻煩,比如控制數字所佔位數,或者小數點後位數。至少繁雜得讓我總是記不起來,寧可使用C風格snprintf來控制。比如

 double d = 3.1415926;
 snprintf(buf, BUFFSIZE, "圓周率: %-8.3lf是祖沖之發現的\n", d);
$ ./a.out 
圓周率: 3.142 是祖沖之發現的

通過%-8.3lf將lf(long float即double)類型的浮點數設置佔位數爲8,設置小數點後位數爲3,負號表示左對齊,這種表示方法非常簡單緊湊。

至於用C++的iomanip頭文件實現,我還花了點時間查文檔。

 double d = 3.1415926;
 os << "圓周率: " << std::setw(8) << std::fixed
  << std::setprecision(3) << std::left
  << d << "是祖沖之發現的\n";

除了代碼如此之長以及有可能漏掉std::fixed外,還有問題在於setprecision已經改變了默認設置,也就是說,如果再os <<傳入一個浮點數,保留的小數點位數仍然是3位。

也許有人說,這種好處在於setprecision和setw接收的可以是一個變量而非常量。實際上snprintf一樣可以做到。

 double d = 3.1415926;
 int n1 = 8, n2 = 3;
 snprintf(buf, BUFFSIZE, "圓周率: %-*.*lf是祖沖之發現的\n", n1, n2, d);

C++包裝snprintf生成格式化的std::string對象

APUE UNP TLPI這幾本講Linux下C編程的書中,都自己寫了錯誤處理庫來包裝snprintf產生格式化的輸出,以免每次重複定義緩衝區/調用snprintf等等。

這樣的做法有個缺陷就是緩衝區(字符數組)長度有限制,當然一般而言buffer size定義得足夠大的話是足夠的,畢竟打印太長的格式化字符串不如多調用幾次函數。

另一方面,由於這些函數僅僅是打印信息,尤其是經常打印信息後直接退出程序。所以不會返回錯誤字符串。如果在C++中想要把錯誤信息作爲異常傳給上一層處理,這些函數是不夠的。因此需要簡單修改下。

inline std::string format_string(const char* format, va_list args) {
 constexpr size_t oldlen = BUFSIZ;
 char buffer[oldlen]; // 默認棧上的緩衝區
 va_list argscopy;
 va_copy(argscopy, args);
 size_t newlen = vsnprintf(&buffer[0], oldlen, format, args) + 1;
 newlen++; // 算上終止符'\0'
 if (newlen > oldlen) { // 默認緩衝區不夠大,從堆上分配
  std::vector<char> newbuffer(newlen);
  vsnprintf(newbuffer.data(), newlen, format, argscopy);
  return newbuffer.data();
 }
 return buffer;
}

inline std::string format_string(const char* format, ...) {
 va_list args;
 va_start(args, format);
 auto s = format_string(format, args);
 va_end(args);

 return s;
}

這是模仿UNP的實現,定義形參爲va_list和...的兩個版本,其中接受va_list的版本還可爲其它函數所用。因爲C風格的可變參數列表...不能作爲參數傳遞。另一點,va_list類型也不一定有拷貝構造函數,因此得用va_copy來拷貝一份va_list,以供第二次使用。

C++11新增了可變模板參數特性,使得上述代碼可以得到簡化

template <typename ...Args>
inline std::string format_string(const char* format, Args... args) {
  constexpr size_t oldlen = BUFSIZ;
  char buffer[oldlen]; // 默認棧上的緩衝區

  size_t newlen = snprintf(&buffer[0], oldlen, format, args...);
  newlen++; // 算上終止符'\0'

  if (newlen > oldlen) { // 默認緩衝區不夠大,從堆上分配
    std::vector<char> newbuffer(newlen);
    snprintf(newbuffer.data(), newlen, format, args...);
    return std::string(newbuffer.data());
  }

  return buffer;
}

而傳遞可變模板參數也變得十分容易(使用forward完美轉發),示例代碼如下

xyz@ubuntu:~/unp_practice/lib$ cat test.cc 
#include <string.h>
#include <unistd.h>
#include "format_string.h"

template <typename ...Args>
void errExit(const char* format, Args... args) {
  auto errmsg = format_string(format, std::forward<Args>(args)...);
  errmsg = errmsg + ": " + strerror(errno) + "\n";
  fputs(errmsg.c_str(), stderr);
  exit(1);
}

int main() {
  const char* s = "hello world!";
  int fd = -1;
  if (write(fd, s, strlen(s)) == -1)
    errExit("write \"%s\" to file descriptor(%d) failed", s, fd);
  return 0;
}
xyz@ubuntu:~/unp_practice/lib$ g++ test.cc -std=c++11
xyz@ubuntu:~/unp_practice/lib$ ./a.out 
write "hello world!" to file descriptor(-1) failed: Bad file descriptor

總結

以上就是這篇文章的全部內容了,希望本文的內容對大家的學習或者工作具有一定的參考學習價值,謝謝大家對神馬文庫的支持。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章