之所以使用不同的漢字輸入法能在計算機中找到同一個漢字,是因爲漢字的編碼方式是固定的。每個漢字都有一個唯一的標準編碼,稱爲國標碼。英文中的字母按照統一的美國標準,在計算機中就分別用了26個二進位代碼來表示26個大寫字母,再用26個代碼來表示26個小寫的字母。例如,字母「A」所分配的代碼是1000001,而字母「a」所分配的代碼就是1100001,這種統一的標準代碼叫作ASCII碼。漢字的數量要比英文字母多得多,常用的漢字有6763個,用7位編碼就遠遠不夠了,因此漢字的國標碼有14位,例如,漢字「啊」的國標代碼就是01100000100001。

  然而,沒有幾個人是能夠記住14位漢字國標碼的,具體的細節要由計算機來操作。人們輸入一個漢字讓計算機來保存和處理,並讓存儲在計算機中的漢字正確顯示在螢幕上或者列印在紙張上,這個過程還涉及三種代碼,即漢字機內碼、漢字輸入碼和漢字字形碼。漢字在存儲、加工處理和傳輸時使用的是漢字機內碼,它通常是將14位的國標碼分成兩組,並在每組7位代碼前面添加一位1成爲8位,這樣就變成一個16位的代碼。漢字輸入碼是漢字輸入時按照漢字的發音、字形,在西文鍵盤上敲入的一組按鍵編碼。通過按鍵編碼,藉助漢字輸入軟體,就可以選擇出你想輸入的漢字了,軟體通過查找漢字機內碼庫可找出其機內碼,並進行存儲和處理。

  不同輸入法選中的同一個字的機內碼是相同的,因此在計算機中找到的是同一個漢字,而按照同樣的機內碼找到的漢字字形碼也是相同的,因此可以顯示或者列印同樣的漢字。