Situs web yang sama menampilkan tantangan reCAPTCHA dalam bahasa Inggris kepada satu pengunjung dan dalam bahasa Jepang kepada pengunjung lainnya. Widget Cloudflare Turnstile menampilkan teks pemuatannya dalam bahasa browser. Beberapa situs menyajikan jenis CAPTCHA yang sangat berbeda berdasarkan wilayah yang terdeteksi pengunjung. Memahami bagaimana pelokalan memengaruhi CAPTCHA membantu Anda menanganinya dengan benar dalam otomatisasi.
Apa yang Berubah dengan Lokal
| penyedia CAPTCHA | Apa yang dilokalisasi | Apa yang tetap sama |
|---|---|---|
| reCAPTCHA | Teks UI, label gambar, bahasa audio | Kunci situs, alur verifikasi, format token |
| Cloudflare Turnstile | Teks widget dan pesan error | Kunci situs, format token, mekanisme penyelesaian |
| hCaptcha | Instruksi tantangan, label kategori | Kunci situs, format token |
| Image/OCR | Kumpulan karakter, bahasa teks | Format gambar, alur submit/poll |
Bagaimana Bahasa Terdeteksi
Penyedia CAPTCHA menentukan bahasa melalui beberapa sinyal:
1. Header Accept-Language
Accept-Language: ja-JP,ja;q=0.9,en-US;q=0.8,en;q=0.7
Ini memberi tahu server: pilih bahasa Jepang (Jepang), lalu Inggris (AS), lalu bahasa Inggris generik. reCAPTCHA dan Cloudflare Turnstile menggunakan ini untuk memilih bahasa UI.
2. Parameter HTML hl
reCAPTCHA menerima parameter bahasa eksplisit saat dimuat:
<!-- Force English reCAPTCHA -->
<script src="https://www.google.com/recaptcha/api.js?hl=en"></script>
<!-- Force Japanese -->
<script src="https://www.google.com/recaptcha/api.js?hl=ja"></script>
Parameter hl menggantikan header Accept-Language. Saat menyelesaikannya, Anda tidak perlu mencocokkan ini — CaptchaAI mengembalikan token apapun bahasa UI-nya.
3. Lokasi Geo-IP
Beberapa konfigurasi CAPTCHA berbeda-beda menurut wilayah:
| Sinyal | Efek |
|---|---|
| IP dari Tiongkok | Mungkin mendapatkan GeeTest alih-alih reCAPTCHA (reCAPTCHA diblokir di Tiongkok) |
| IP dari UE | Dapat melihat persetujuan GDPR sebelum CAPTCHA |
| IP dari wilayah terlarang | Mungkin mendapat tantangan yang lebih ketat |
4. Peramban navigator.language
CAPTCHA berbasis JavaScript membaca bahasa browser:
navigator.language // "en-US"
navigator.languages // ["en-US", "en", "ja"]
Di browser headless, ini default ke sistem lokal. Tetapkan secara eksplisit agar sesuai dengan target Anda:
// Playwright
const context = await browser.newContext({
locale: 'ja-JP',
});
// Puppeteer
const page = await browser.newPage();
await page.setExtraHTTPHeaders({
'Accept-Language': 'ja-JP,ja;q=0.9',
});
Dampak pada Pemecahan
CAPTCHA Berbasis Token (reCAPTCHA, Cloudflare Turnstile, hCaptcha)
Pengaturan bahasa mempengaruhi UI namun tidak mempengaruhi token. Proses penyelesaian CaptchaAI tidak bergantung pada bahasa:
- Kirimkan kunci situs dan URL halaman
- CaptchaAI mengembalikan token yang valid
- Token berfungsi apa pun bahasa yang ditampilkan widget CAPTCHA
Tidak diperlukan parameter bahasa saat memanggil CaptchaAI untuk CAPTCHA berbasis token.
Gambar CAPTCHA
Bahasa secara langsung mempengaruhi karakter dalam gambar:
| Bahasa situs | konten CAPTCHA | Parameter bahasa CaptchaAI |
|---|---|---|
| bahasa Inggris | "Masukkan teks: XKCD42" | 0 (default/Latin) |
| Rusia | "Teksnya: ШКАФ" | 1 (Sirilik) atau 2 |
| Cina | "请输入验证码: 汉字" | 2 (non-Latin) |
| Arab | "أدخل النص: عربي" | 2 (non-Latin) |
| Jepang | "文字を入力: ひらがな" | 2 (non-Latin) |
CAPTCHA Audio
Tantangan audio reCAPTCHA diucapkan dalam bahasa yang cocok dengan parameter hl atau header Accept-Language. CaptchaAI menangani hal ini melalui alur penyelesaian reCAPTCHA standarnya — metode penyelesaiannya tidak bergantung pada bahasa audio.
Masalah Lokalisasi Umum
Bahasa Tidak Cocok Antara Scraper dan Target
Jika scraper Anda mengirimkan Accept-Language: en-US ke situs Jepang, CAPTCHA mungkin ditampilkan dalam bahasa Inggris — yang cocok untuk CAPTCHA berbasis token tetapi dapat menyebabkan masalah jika situs memvalidasi konsistensi bahasa.
Perbedaan Penyedia CAPTCHA Regional
Beberapa negara menggunakan penyedia CAPTCHA yang berbeda:
| Wilayah | Penyedia tipikal |
|---|---|
| Pasar Barat | reCAPTCHA, Cloudflare Turnstile, hCaptcha |
| Cina | GeeTest, Tencent CAPTCHA, image khusus |
| Rusia/CIS | Image CAPTCHA khusus, reCAPTCHA |
| Korea Selatan | Slider khusus, image CAPTCHA |
Pemecahan Masalah
| Masalah | Penyebab | Solusi |
|---|---|---|
| reCAPTCHA menampilkan bahasa berbeda dari yang diharapkan | Parameter hl dalam script tag vs header Accept-Language tidak cocok |
Token tidak bergantung bahasa — tidak mempengaruhi penyelesaian |
| Karakter image CAPTCHA salah dikenali | Param bahasa tidak cocok dengan skrip CAPTCHA | Set language=2 untuk CAPTCHA non-Latin |
| Situs menyajikan tipe CAPTCHA berbeda per wilayah | Pemilihan penyedia berbasis geo-IP | Gunakan proxy yang cocok dengan wilayah target |
| Browser headless menampilkan lokal yang salah | Lokal sistem default digunakan | Set lokal secara eksplisit dalam konteks browser |
| Audio CAPTCHA dalam bahasa yang tidak terduga | Parameter hl mengesampingkan header |
Tidak mempengaruhi penyelesaian berbasis token CaptchaAI |
Pertanyaan Umum
Apakah CaptchaAI perlu mengetahui bahasa tampilan CAPTCHA?
Untuk CAPTCHA berbasis token (reCAPTCHA, Turnstile, hCaptcha), no. Proses penyelesaiannya tidak bergantung pada bahasa. Untuk CAPTCHA Image/OCR, ya — atur parameter language agar sesuai dengan rangkaian karakter yang ditampilkan dalam gambar.
Haruskah saya mencocokkan tajuk Bahasa Terima saya dengan situs target?
Ini adalah praktik yang baik untuk konsistensi. Beberapa situs memeriksa ketidakcocokan bahasa antara header dan sinyal lainnya. Atur header Accept-Language Anda agar sesuai dengan bahasa utama situs untuk meminimalkan risiko deteksi.
Bisakah kunci situs yang sama menunjukkan tingkat kesulitan CAPTCHA yang berbeda berdasarkan lokal?
Ya. Penyedia CAPTCHA dapat menyesuaikan tingkat kesulitan berdasarkan skor risiko regional. Lalu lintas dari wilayah tertentu mungkin menghadapi tantangan yang lebih berat. Hal ini tidak memengaruhi penyelesaian CaptchaAI — API menangani tantangan dengan tingkat kesulitan apa pun.
Langkah Selanjutnya
Tangani CAPTCHA di lokasi mana pun — dapatkan kunci API CaptchaAI Anda dan konfigurasikan pengaturan bahasa dengan benar.
Panduan terkait:
- Memecahkan CAPTCHA di Situs Web China
- Memecahkan CAPTCHA di Website Jepang dan Korea