徹底弄懂爲什麼不能把棧上分配的數組（字符串）作爲返回值

原創

2019-10-13 16:15

背景

最近準備從 C 語言零基礎到 PHP 擴展開發實戰，案例的過程中準備瞭如下代碼碎片，演示解析http scheme

#include <stdio.h>
#include <stdlib.h>
#include <string.h>

char *parse_scheme(const char *url)
{
    char *p = strstr(url,"://");
    return strndup(url,p-url);
}

int main()
{
    const char *url = "http://static.mengkang.net/upload/image/2019/0907/1567834464450406.png";
    char *scheme = parse_scheme(url);
    printf("%s\n",scheme);
    free(scheme);
    return 0;
}

上面是通過strndup的方式，背後也依託了malloc，所以最後也需要free。
有人在微信羣私信parse_scheme能用char []來做返回值嗎？我們知道棧上的數組也能用來存儲字符串，那我們可以改寫成下面這樣嗎？

char *parse_scheme(const char *url)
{
    char *p = strstr(url,"://");
    long l = p - url + 1;
    char scheme[l];
    strncpy(scheme, url, l-1);
    return scheme;
}

大多數人都知道不能這樣寫，因爲返回的是棧上的地址，當從該函數返回之後，那段棧空間的操作權也釋放了，當再次使用該地址的時候，值就是不確定的了。

那我們今天就一起探討下出現這樣情況的背後的真正原理。

基礎預備

每個函數運行的時候因爲需要內存來存放函數參數以及局部變量等，需要給每個函數分配一段連續的內存，這段內存就叫做函數的棧幀（Stack Frame）。
因爲是一塊連續的內存地址，所以叫幀；爲什麼叫要加一個棧呢？
想必大家都熟悉了函數調用棧，爲什麼叫函數調用棧呢？比如下面的表達式

array_values(explode(",",file_get_contents(...)));

函數的執行順序是最內層的函數最先執行，然後依次返回執行外層的函數。所以函數的執行就是利用了棧的數據結構，所以就叫棧幀。

x86_64 cpu上的 rbp 寄存器存函數棧底地址，rsp 寄存器存函數棧頂地址。

實驗

#include <stdio.h>

void foo(void)
{
    int i;
    printf("%d\n", i);
    i = 666;
}

int main(void)
{
    foo();
    foo();
    return 0;
}

$gcc -g 2.c

$./a.out
0
666

爲什麼第二次調用foo函數輸出的結果都是上次函數調用的賦值呢？先看下反彙編之後的代碼

000000000040052d <foo>:
#include <stdio.h>

void foo(void)
{
  40052d:    55                       push   %rbp
  40052e:    48 89 e5                 mov    %rsp,%rbp
  400531:    48 83 ec 10              sub    $0x10,%rsp
    int i;
    printf("%d\n", i);
  400535:    8b 45 fc                 mov    -0x4(%rbp),%eax
  400538:    89 c6                    mov    %eax,%esi
  40053a:    bf 00 06 40 00           mov    $0x400600,%edi
  40053f:    b8 00 00 00 00           mov    $0x0,%eax
  400544:    e8 c7 fe ff ff           callq  400410 <printf@plt>
    i = 666;
  400549:    c7 45 fc 9a 02 00 00     movl   $0x29a,-0x4(%rbp)
}
  400550:    c9                       leaveq
  400551:    c3                       retq

0000000000400552 <main>:

int main(void)
{
  400552:    55                       push   %rbp
  400553:    48 89 e5                 mov    %rsp,%rbp
    foo();
  400556:    e8 d2 ff ff ff           callq  40052d <foo>
    foo();
  40055b:    e8 cd ff ff ff           callq  40052d <foo>
    return 0;
  400560:    b8 00 00 00 00           mov    $0x0,%eax
}
  400565:    5d                       pop    %rbp
  400566:    c3                       retq
  400567:    66 0f 1f 84 00 00 00     nopw   0x0(%rax,%rax,1)
  40056e:    00 00

理論分析

第一次進入 foo函數前後

在進入foo函數之前，因爲main裏沒有參數也沒有局部變量，所以，main 的棧幀的長度就是0，rbp和rsp相等（0x7fffffffe2c0）。當執行

callq  40052d <foo>

會把main函數的在調用foo之後需要返回執行的下一行代碼的地址壓棧，因爲是64位機器，地址8字節。
進入foo之後

push   %rbp

把rbp的值壓棧，因爲也是存的地址，所以又佔了8字節，所以當初始化foo函數的rbp的時候

mov    %rsp,%rbp

rsp已經在原來的基礎上加了16字節，所以從0x7fffffffe2c0變成了0x7fffffffe2b0。

sub    $0x10,%rsp

因爲foo函數裏面局部變量，編譯的時候就預留了16字節，所以rsp變爲了0x7fffffffe2a0
最後執行了

movl   $0x29a,-0x4(%rbp)

將666放在了0x7fffffffe2ac，當第二次調用的時候，打印i的彙編代碼如下

    printf("%d\n", i);
  400535:    8b 45 fc                 mov    -0x4(%rbp),%eax
  400538:    89 c6                    mov    %eax,%esi
  40053a:    bf 00 06 40 00           mov    $0x400600,%edi
  40053f:    b8 00 00 00 00           mov    $0x0,%eax
  400544:    e8 c7 fe ff ff           callq  400410 <printf@plt>

第二次進入 foo函數前後

因爲上次-0x4(%rbp)存了666，而第二次調用foo的rbp的值又和第一次一樣，所以是一個地址。所以666就被打印出來了。

回到主題

#include <stdio.h>
#include <stdlib.h>
#include <string.h>

char *parse_scheme(const char *url)
{
    char *p = strstr(url,"://");
    long l = p - url + 1;
    char scheme[l];
    strncpy(scheme, url, l-1);
    printf("%s\n",scheme);
    return scheme;
}

int main()
{
    const char *url = "http://static.mengkang.net/upload/image/2019/0907/1567834464450406.png";
    char *scheme = parse_scheme(url);
    printf("%s\n",scheme);

    return 0;
}

調試信息如下，當從parse_scheme返回時，打印scheme的結果還是http，但是當我們調用printf之後，和上面樣例中一樣，parse_scheme出棧，printf入棧，則棧上內存就又替換了，所以打印出來的結果則不一定是http了。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

徹底弄懂爲什麼不能把棧上分配的數組（字符串）作爲返回值

背景

基礎預備

實驗

理論分析

回到主題

藍橋15屆stema編程題密碼鎖-動態規劃 C++和Python最後一道題

2021看雪SDC議題回顧 | SaTC：一種全新的物聯網設備漏洞自動化挖掘方法

C# 代碼學習

Kafka存儲機制

aws語音呼叫調用，告警電話

【轉】[C#] WebAPI 防止併發調用二（冥等性）

HTTP URL 詳解

得物 ZooKeeper SLA 也可以 99.99%

創新工具：2024年開發者必備的一款表格控件（二）

車牌識別控制檯可快速整合二次開發

又一道好題

美麗區間

SEO行業沒落了嗎？

布丁粉的製作方法

如何學習PYTHON(python和c++哪個難學)

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結