百度面試:刪除ansi編碼中的字母和數字

已知一個字串由GBK漢字和ansi編碼的數字字母混合組成,編寫C語言函數實現從中去掉所有ansi編碼的的數字和字母(包括大小寫),要求在原字串上返回結果。函數接口爲:int filter_ansi(char*gbk_string)。注:漢字的GBK編碼範圍是0x8140 - 0xFEFE


代碼中,只刪除了ansi編碼和數字,如果有別的非漢字字符,則保留。

區分漢字和字母、數字,就看最高位是否爲1!


int filter_ansi(char* gbk_string)
{
   char *p = gbk_string, *q = gbk_string;
   while (*q != '\0')
   {
      if ((*q >= 0) && (*q <= 128))   //判斷是否爲asci的字符
      {
         if (((*q >= '0') && (*q <= '9'))    //判斷是否爲數字或字母
             || ((*q >= 'a') && (*q <= 'z')) 
             || ((*q >= 'A') && (*q <= 'Z')))        
         {
            q++;
         }
         else       
         {
            *p++ = *q++;
	}
       }
       else
       {
          if (((*((unsigned short*)q)) >= 0x8140) && ((*((unsigned short*)q)) <= 0xFEFE)) //是漢字 
          {
	     *p++ = *((char*)q)++;
	     *p++ = *((char*)q)++;
          }
	 else    //不是漢字
	 {
	      q++;
	      q++;
	 }
        }
   }
   *p = '\0';
   
   return (p - gbk_string);
} 


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章