PHP CURL 操作之批量翻譯文件名

最近有人跟我說有沒有可以批量把文件名翻譯成中文的,我就嘗試寫了一下。本想調用讀取文件名後調用百度翻譯進行翻譯,但是我用fiddler 修改翻譯的字符串重新請求都不行,裏面生成的各種參數較爲複雜,所以懶人的我選擇了百度翻譯中間的過渡翻譯(就是按一個字母就能立即觸發事件給你跳出一系列你可能需要翻譯的詞彙,算是即時翻譯吧)。我本意是用百度翻譯把其他語言都轉成漢語,但是調用這個過渡的翻譯,它只支持英文轉漢語,但是怎麼說也是寫了一點,故留點代碼供以後參考。

其中用到了php 的 curl ,以及php對於文件的操作正則匹配

具體代碼如下:

<?php

//修改test目錄下的文件名
//目錄是相對該文件的目錄
change('test');



/**
 * 轉換文件名成中文(暫時只支持英文轉中文)
 * @param $dir string 相對於當前目錄的文件夾(必選參數)
 */
function change($dir = '')
{
    if(is_dir($dir)) //判斷是否爲一個目錄
    {
        if($handler = opendir($dir))  //讀取所有文件夾下的文件名
        {
            while( ($filename = readdir($handler)) !== false )
            {
                //過濾 .  和  ..  兩個文件夾
                if($filename == "." || $filename == "..") continue;

                $name = substr($filename, 0, strrpos($filename,'.')); //獲取文件名
                $suffix = substr($filename, strrpos($filename,'.'));  //獲取文件的後綴

                $new_name = bdTranslation($name);  //獲取翻譯後的新名字
                if(empty($new_name)) continue;

                $new_filename = $dir.'/'.$new_name.$suffix; //新文件名的路徑
                $old_filename = $dir.'/'.$filename;  //舊文件名的路徑

                if(file_exists($new_filename) || !file_exists($old_filename)){
                    //判斷新文件是否存在或者舊文件已經不存在導致的無法修改
                    echo "{$new_filename} already exists or {$old_filename} does not exist";
                    echo "</br>";
                }else{
                    //重命名文件
                    @rename(iconv('UTF-8','GBK',$old_filename), iconv('UTF-8','GBK',$new_filename));
                }

            }
            //釋放資源
            closedir($handler);

            echo "success";

        }else{
            echo "{$dir} is open failed";
        }
    }else{
        echo "{$dir} is not a dir";
    }

}

/**
 * 調用百度翻譯(抓取的地址只是中間過度的地址,翻譯的並非完全正確)
 * @param $name
 * @return mixed
 */
function bdTranslation($name)
{
    $url = "https://fanyi.baidu.com/sug";
    $cfg['ssl'] = true;
    $cfg['post'] = [
        'kw' => $name
    ];

    $result = curlOpen($url,$cfg);
    $result = json_decode($result,true);

    if(empty($result['data'][0]['v'])) return '';

    //優先匹配名名詞
    preg_match("/n\. ([\x{4e00}-\x{9fa5}]+)/u",$result['data'][0]['v'],$match);
    if($match){
        return $match[1];
    }
    else{
        //名詞不存在則匹配第一個解釋
        preg_match("/([\x{4e00}-\x{9fa5}]+)/u",$result['data'][0]['v'],$match);
        if($match) return $match[0];
        else return '';
    }

}

/**
 * 封裝好的curl
 * @param $url
 * @param array $config
 * @return mixed
 */
function curlOpen($url, $config = array())
{
    $arr = array('post' => false,'referer' => $url,'cookie' => '', 'useragent' => 'Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 6.0; Trident/4.0; SLCC1; .NET CLR 2.0.50727; .NET CLR 3.0.04506; customie8)', 'connectout'=>3, 'timeout' => 10, 'return' => true, 'proxy' => '', 'userpwd' => '', 'nobody' => false,'header'=>array(),'gzip'=>true,'ssl'=>false,'isupfile'=>false,'returnheader'=>false);
    $arr = array_merge($arr, $config);
    $ch = curl_init();

    curl_setopt($ch, CURLOPT_URL, $url);
    curl_setopt($ch, CURLOPT_RETURNTRANSFER, $arr['return']);
    curl_setopt($ch, CURLOPT_NOBODY, $arr['nobody']);
    curl_setopt($ch, CURLOPT_FOLLOWLOCATION, 1);
    curl_setopt($ch, CURLOPT_USERAGENT, $arr['useragent']);
    curl_setopt($ch, CURLOPT_REFERER, $arr['referer']);
    curl_setopt($ch, CURLOPT_CONNECTTIMEOUT, $arr['connectout']);
    curl_setopt($ch, CURLOPT_TIMEOUT, $arr['timeout']);
    curl_setopt($ch, CURLOPT_HEADER, $arr['returnheader']);//��ȡheader
    if($arr['gzip']) curl_setopt($ch, CURLOPT_ENCODING, 'gzip,deflate');
    if($arr['ssl'])
    {
        curl_setopt($ch, CURLOPT_SSL_VERIFYPEER, false);
        curl_setopt($ch, CURLOPT_SSL_VERIFYHOST, false);
    }
    if(!empty($arr['cookie']))
    {
        if(substr($arr['cookie'], -4) == '.txt'){
            curl_setopt($ch, CURLOPT_COOKIEJAR, $arr['cookie']);
            curl_setopt($ch, CURLOPT_COOKIEFILE, $arr['cookie']);
        }else{
            curl_setopt($ch, CURLOPT_COOKIE, $arr['cookie']);
        }

    }

    if(!empty($arr['proxy']))
    {
        //curl_setopt($ch, CURLOPT_PROXYTYPE, CURLPROXY_HTTP);
        curl_setopt ($ch, CURLOPT_PROXY, $arr['proxy']);
        if(!empty($arr['userpwd']))
        {
            curl_setopt($ch,CURLOPT_PROXYUSERPWD,$arr['userpwd']);
        }
    }

    if(!empty($arr['header']['ip']))
    {
        array_push($arr['header'],'X-FORWARDED-FOR:'.$arr['header']['ip'],'CLIENT-IP:'.$arr['header']['ip']);
        unset($arr['header']['ip']);
    }
    $arr['header'] = array_filter($arr['header']);

    if(!empty($arr['header']))
    {
        curl_setopt($ch, CURLOPT_HTTPHEADER, $arr['header']);
    }

    if ($arr['post'] != false)
    {
        curl_setopt($ch, CURLOPT_POST, true);
        if(is_array($arr['post']) && $arr['isupfile'] === false)
        {
            $post = http_build_query($arr['post']);
        }
        else
        {
            $post = $arr['post'];
        }
        curl_setopt($ch, CURLOPT_POSTFIELDS, $post);
    }
    $result = curl_exec($ch);
    //var_dump(curl_getinfo($ch));
    curl_close($ch);

    return $result;
}


 

 

若有什麼錯誤的地方或者需要改進的地方,歡迎大家提出

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章