Penjelasan Mendalam

Lokalisasi CAPTCHA: Bagaimana Pengaturan Bahasa Mempengaruhi Tantangan

Situs web yang sama menampilkan tantangan reCAPTCHA dalam bahasa Inggris kepada satu pengunjung dan dalam bahasa Jepang kepada pengunjung lainnya. Widget Cloudflare Turnstile menampilkan teks pemuatannya dalam bahasa browser. Beberapa situs menyajikan jenis CAPTCHA yang sangat berbeda berdasarkan wilayah yang terdeteksi pengunjung. Memahami bagaimana pelokalan memengaruhi CAPTCHA membantu Anda menanganinya dengan benar dalam otomatisasi.

Apa yang Berubah dengan Lokal

penyedia CAPTCHA Apa yang dilokalisasi Apa yang tetap sama
reCAPTCHA Teks UI, label gambar, bahasa audio Kunci situs, alur verifikasi, format token
Cloudflare Turnstile Teks widget dan pesan error Kunci situs, format token, mekanisme penyelesaian
hCaptcha Instruksi tantangan, label kategori Kunci situs, format token
Image/OCR Kumpulan karakter, bahasa teks Format gambar, alur submit/poll

Bagaimana Bahasa Terdeteksi

Penyedia CAPTCHA menentukan bahasa melalui beberapa sinyal:

1. Header Accept-Language

Accept-Language: ja-JP,ja;q=0.9,en-US;q=0.8,en;q=0.7

Ini memberi tahu server: pilih bahasa Jepang (Jepang), lalu Inggris (AS), lalu bahasa Inggris generik. reCAPTCHA dan Cloudflare Turnstile menggunakan ini untuk memilih bahasa UI.

2. Parameter HTML hl

reCAPTCHA menerima parameter bahasa eksplisit saat dimuat:

<!-- Force English reCAPTCHA -->
<script src="https://www.google.com/recaptcha/api.js?hl=en"></script>

<!-- Force Japanese -->
<script src="https://www.google.com/recaptcha/api.js?hl=ja"></script>

Parameter hl menggantikan header Accept-Language. Saat menyelesaikannya, Anda tidak perlu mencocokkan ini — CaptchaAI mengembalikan token apapun bahasa UI-nya.

3. Lokasi Geo-IP

Beberapa konfigurasi CAPTCHA berbeda-beda menurut wilayah:

Sinyal Efek
IP dari Tiongkok Mungkin mendapatkan GeeTest alih-alih reCAPTCHA (reCAPTCHA diblokir di Tiongkok)
IP dari UE Dapat melihat persetujuan GDPR sebelum CAPTCHA
IP dari wilayah terlarang Mungkin mendapat tantangan yang lebih ketat

4. Peramban navigator.language

CAPTCHA berbasis JavaScript membaca bahasa browser:

navigator.language       // "en-US"
navigator.languages      // ["en-US", "en", "ja"]

Di browser headless, ini default ke sistem lokal. Tetapkan secara eksplisit agar sesuai dengan target Anda:

// Playwright
const context = await browser.newContext({
  locale: 'ja-JP',
});

// Puppeteer
const page = await browser.newPage();
await page.setExtraHTTPHeaders({
  'Accept-Language': 'ja-JP,ja;q=0.9',
});

Dampak pada Pemecahan

CAPTCHA Berbasis Token (reCAPTCHA, Cloudflare Turnstile, hCaptcha)

Pengaturan bahasa mempengaruhi UI namun tidak mempengaruhi token. Proses penyelesaian CaptchaAI tidak bergantung pada bahasa:

  • Kirimkan kunci situs dan URL halaman
  • CaptchaAI mengembalikan token yang valid
  • Token berfungsi apa pun bahasa yang ditampilkan widget CAPTCHA

Tidak diperlukan parameter bahasa saat memanggil CaptchaAI untuk CAPTCHA berbasis token.

Gambar CAPTCHA

Bahasa secara langsung mempengaruhi karakter dalam gambar:

Bahasa situs konten CAPTCHA Parameter bahasa CaptchaAI
bahasa Inggris "Masukkan teks: XKCD42" 0 (default/Latin)
Rusia "Teksnya: ШКАФ" 1 (Sirilik) atau 2
Cina "请输入验证码: 汉字" 2 (non-Latin)
Arab "أدخل النص: عربي" 2 (non-Latin)
Jepang "文字を入力: ひらがな" 2 (non-Latin)

CAPTCHA Audio

Tantangan audio reCAPTCHA diucapkan dalam bahasa yang cocok dengan parameter hl atau header Accept-Language. CaptchaAI menangani hal ini melalui alur penyelesaian reCAPTCHA standarnya — metode penyelesaiannya tidak bergantung pada bahasa audio.

Masalah Lokalisasi Umum

Bahasa Tidak Cocok Antara Scraper dan Target

Jika scraper Anda mengirimkan Accept-Language: en-US ke situs Jepang, CAPTCHA mungkin ditampilkan dalam bahasa Inggris — yang cocok untuk CAPTCHA berbasis token tetapi dapat menyebabkan masalah jika situs memvalidasi konsistensi bahasa.

Perbedaan Penyedia CAPTCHA Regional

Beberapa negara menggunakan penyedia CAPTCHA yang berbeda:

Wilayah Penyedia tipikal
Pasar Barat reCAPTCHA, Cloudflare Turnstile, hCaptcha
Cina GeeTest, Tencent CAPTCHA, image khusus
Rusia/CIS Image CAPTCHA khusus, reCAPTCHA
Korea Selatan Slider khusus, image CAPTCHA

Pemecahan Masalah

Masalah Penyebab Solusi
reCAPTCHA menampilkan bahasa berbeda dari yang diharapkan Parameter hl dalam script tag vs header Accept-Language tidak cocok Token tidak bergantung bahasa — tidak mempengaruhi penyelesaian
Karakter image CAPTCHA salah dikenali Param bahasa tidak cocok dengan skrip CAPTCHA Set language=2 untuk CAPTCHA non-Latin
Situs menyajikan tipe CAPTCHA berbeda per wilayah Pemilihan penyedia berbasis geo-IP Gunakan proxy yang cocok dengan wilayah target
Browser headless menampilkan lokal yang salah Lokal sistem default digunakan Set lokal secara eksplisit dalam konteks browser
Audio CAPTCHA dalam bahasa yang tidak terduga Parameter hl mengesampingkan header Tidak mempengaruhi penyelesaian berbasis token CaptchaAI

Pertanyaan Umum

Apakah CaptchaAI perlu mengetahui bahasa tampilan CAPTCHA?

Untuk CAPTCHA berbasis token (reCAPTCHA, Turnstile, hCaptcha), no. Proses penyelesaiannya tidak bergantung pada bahasa. Untuk CAPTCHA Image/OCR, ya — atur parameter language agar sesuai dengan rangkaian karakter yang ditampilkan dalam gambar.

Haruskah saya mencocokkan tajuk Bahasa Terima saya dengan situs target?

Ini adalah praktik yang baik untuk konsistensi. Beberapa situs memeriksa ketidakcocokan bahasa antara header dan sinyal lainnya. Atur header Accept-Language Anda agar sesuai dengan bahasa utama situs untuk meminimalkan risiko deteksi.

Bisakah kunci situs yang sama menunjukkan tingkat kesulitan CAPTCHA yang berbeda berdasarkan lokal?

Ya. Penyedia CAPTCHA dapat menyesuaikan tingkat kesulitan berdasarkan skor risiko regional. Lalu lintas dari wilayah tertentu mungkin menghadapi tantangan yang lebih berat. Hal ini tidak memengaruhi penyelesaian CaptchaAI — API menangani tantangan dengan tingkat kesulitan apa pun.

Langkah Selanjutnya

Tangani CAPTCHA di lokasi mana pun — dapatkan kunci API CaptchaAI Anda dan konfigurasikan pengaturan bahasa dengan benar.

Panduan terkait:

  • Memecahkan CAPTCHA di Situs Web China
  • Memecahkan CAPTCHA di Website Jepang dan Korea
Komentar dinonaktifkan untuk artikel ini.