UnCAPTCHA: utilizați serviciile Google pentru a ocoli Google reCAPTCHA. A scăpa de captcha enervant de pe VKontakte Cum roboții ocolesc captcha

10.05.2020 Interesant

Multe site-uri folosesc acum Recaptcha de la Google și din motive întemeiate: o soluție simplă și convenabilă pentru combaterea spam-ului. Dar, în același timp, multe minți se luptă să descifreze algoritmii Google Captcha pentru a ocoli această măsură de protecție. Metodele sunt destul de originale și interesante; lucrul amuzant este că tehnologiile Google în cele mai multe cazuri ajută la piratarea Recaptcha. Cum se întâmplă acest lucru și de ce, vom lua în considerare în materialul nostru.

În primul rând, o mică teorie. Inițial, conceptul de captcha însemna introducerea de caractere dintr-o imagine: litere, cifre sau o combinație literă-cifre. De-a lungul timpului, au apărut programe pentru recunoașterea textului, iar captcha a început să devină mai complicată: a început să apară un fundal, literele și cifrele au început să fie situate într-un unghi, numărul de caractere pentru introducere a început să varieze, s-au adăugat zgomot și interferențe. pentru a exclude recunoașterea automată. Exact așa arăta prima versiune de recaptcha, care era atât de urâtă de mulți utilizatori.

În cele din urmă, totul s-a rezumat la faptul că complicarea imaginii pentru intrare nu a dat un efect vizibil, ci doar a făcut mai dificilă intrarea utilizatorilor obișnuiți. Cred că mulți oameni își amintesc vremurile când au înjurat deschis, când nu înțelegeai ce simbol era afișat și nu era posibil să intri în captcha prima dată. Și atunci corporația Google a sărit mult înainte, oferind publicului Recaptcha 2. Nu se poate spune că ideea a fost atât de inovatoare - până atunci, multe protecții anti-spam interesante fuseseră deja implementate: punerea la punct a unui puzzle, răspunsul la o întrebare - toti au avut avantajele si dezavantajele lor .

Cea de-a doua versiune a recaptcha a devenit mai inteligentă și mai orientată spre om: a fost suficient să faceți clic pe o bifă pentru a trece verificarea. În situații mai complexe, tendința a fost spre alegerea imaginilor potrivite. Google nu se oprește aici și plănuiește să introducă Invisible Recaptcha în următoarea generație; puteți citi mai multe despre el în articol. Dar, în același timp, mințile hackerilor sunt absorbite de sarcina de a ocoli acest sistem: la urma urmei, atunci spațiul se deschide pentru un număr mare de site-uri.

Unul dintre marile dezavantaje ale tuturor recaptchas-urilor este setul limitat de combinații. În primul recaptcha era un anumit set de cuvinte și fraze, în al doilea era un număr limitat de imagini și aceleași cuvinte în versiunea audio a captcha-ului (ne vom uita la asta puțin mai târziu). Toate acestea, cu abordarea corectă, vă permit să restrângeți cercul în căutarea soluțiilor.

Dintre principalele metode de cracking recaptcha, aș evidenția doar două: selectarea unei combinații de imagini pe care trebuie să se apasă pentru a trece testul și descifrarea înregistrării audio.

Unul dintre primii metode de succes a ajutat la implementarea unui algoritm de recunoaștere a imaginilor pentru selectarea numerelor casei. Apoi au apărut opțiuni de recunoaștere mai complexe, care s-au specializat în Google Recaptcha. Dar Google nu a stat deoparte, imaginile au început să fie supuse la tot felul de procesări: estompare, întindere, distorsiune.

Hack Google Recaptcha folosind Google Speech

După cum s-a dovedit, cea mai vulnerabilă metodă, care a dat cele mai bune rezultate, s-a dovedit a fi recunoașterea captcha dintr-un semnal audio, care este oferită ca opțiune alternativă de ascultat dacă nu puteți trece testul dintr-un motiv oarecare. obține fișier de sunet Este destul de simplu, trebuie să faceți clic pe pictograma cu căști din partea de jos a recaptcha și va fi oferit un mesaj vocal.

Primele încercări de a ataca Google captcha au fost însoțite de programe auto-scrise de recunoaștere a vorbirii, iar rata de recunoaștere a fost destul de mare (parțial din cauza numărului limitat de fraze audio). După publicarea programului pentru public, Google a lansat un patch care a schimbat setul mesaje vocale, și a adăugat, de asemenea, voci și zgomot la vorbire, făcând astfel performanța de ocolire a Recaptcha aproape de zero.

Totuși, și aici a fost găsită o soluție foarte amuzantă. Pentru a ajuta specialiștii în securitate să pirateze Google Recaptcha 2... Google însuși a venit în ajutor! Utilizarea Google API Speech poate fi recunoscută în mod fiabil și precis notificări sonore captcha. Am pus vulnerabilitatea în practică și am scris un serviciu de redirecționare a fișierelor audio către recunoaștere, apoi înlocuim rezultatul în câmpul formularului recaptcha.

Și această gaură a fost reparată și închisă de angajații Google. Acum hackerii vor trebui din nou să dea dovadă de dexteritate și să găsească o nouă metodă de a ocoli recaptcha. Între timp, pe acest moment Aceasta este o opțiune destul de convenabilă și durabilă pentru protejarea împotriva spam-ului din formularele de contact. Acest lucru ridică întrebarea: de ce, în ciuda trucurilor atacatorilor, nu a existat niciun val de spam pe site-uri? Răspunsul este destul de simplu: Google a dezvoltat o protecție destul de complexă și în mai multe etape, care poate limita numărul de bypass-uri. În acest fel, un atac masiv va fi oprit într-un stadiu incipient: de exemplu, aceeași opțiune cu un mesaj audio nu a funcționat întotdeauna; uneori, utilizatorilor li s-a cerut să introducă simboluri în loc să asculte numere.

Între timp, vom aștepta noi știri și noi exploit-uri.

O zi buna, prieteni! Dacă citiți acest articol, înseamnă că aveți probleme și cu Google Recaptcha, pe care îl folosește toată lumea cantitate mare Dar multor utilizatori nu le place, dar un număr tot mai mare de utilizatori îl folosesc. De ce este atât de bun, dezavantajele sale și cum să-l treci, toate acestea pot fi găsite în acest articol.

ReCaptcha a fost creat pentru a proteja site-urile web de roboții de pe Internet și pentru a digitiza textele cărților. Din 2009, deținut de Google.

ce e bun la ea

După cum am menționat mai devreme, avantajele acestui tip de captcha sunt: ​​protecția împotriva spamului și digitizarea textelor cărților.

de ce este rea

Desigur, acest captcha nu este ideal și un bot scris corect poate ocoli cu ușurință astfel de recaptcha-uri.

În plus, mulți utilizatori au probleme cu recaptcha, pe care trebuie să le rezolve de mai multe ori. Mai jos, vă voi spune cum finalizez captch-urile mai repede. Metoda este cu siguranță simplă, dar nu foarte eficientă, dar accelerează timpul petrecut pentru rezolvarea captcha-ului.

Ce am observat?

De exemplu, când rezolvăm o captcha cu indicatoare rutiere, uneori nu există indicatoare rutiere, apoi facem imediat clic pe skip. Dar uneori captcha cu indicatoare rutiere etc. Se întâmplă atunci când sunt selectați și confirmarea este transferată într-un alt captcha. De ce?La rezolvare am dat peste o singură variantă (dacă sunt mai multe, scrieți în comentarii), când dați clic pe poză, butonul „săriți” este înlocuit cu „următorul”. Dacă apare butonul următor, atunci nu veți rezolva acest captcha și veți fi transferat la următorul captcha

Există mai multe nuanțe

cum să-l treci și mici caracteristici ale trecerii captcha.

1) Vedere ReCaptcha

a) Imaginile care dispar (eliminați toate cele inutile)

Astfel de captchas sunt întotdeauna trecute. Personal, nu am avut niciodată probleme cu acest tip de captcha.

b) Selectarea unei imagini sau a unei părți a unei imagini (voi da un exemplu mai jos)

Am avut probleme la alegerea unei poze. Dar nu puteam înțelege de ce. De exemplu, în imaginea de mai jos, sarcina spune: „selectați toate pătratele care conțin semne rutiere. Dacă nu există niciunul, faceți clic pe butonul „săriți””. De fapt, există un indicator rutier P = „parcare”, dar ReCaptcha nu îl va număra, deoarece în loc de butonul „săriți”, apare butonul „următorul”, deși semnul rutier este prezent în sarcină, dar poate că Dezvoltatorii ReCaptcha nu cred. Se întâmplă și situația inversă, dar nu voi da un exemplu în articol, cred că totul este clar pentru toată lumea.

2) Dacă acesta este un captcha cu imagini care nu dispar, atunci selectați un pătrat și uitați-vă la modificarea butonului „săriți”.

a) Dacă butonul s-a schimbat la butonul „următorul”. Nu vei trece de un astfel de captcha, chiar dacă există o soluție.

b) Dacă butonul s-a schimbat într-un buton de „confirmare”, atunci veți trece acest captcha dacă îl treceți corect.

Cu stimă, Mars Magafurov

Google reCaptcha v2 a încetat să fie o problemă pentru utilizatorii noștri. Am introdus integrarea cu popularul serviciu de bypass captcha Death By Captcha, iar acum scraperele dvs. pot ocoli cu ușurință cele mai recente captcha.

Să vedem cum arată reCaptcha v2:

Dacă vedeți un astfel de captcha pe site. pe care trebuie să le analizați, atunci acest articol vă va ajuta cu siguranță. Vom încerca să vă oferim un ghid cuprinzător folosind un exemplu real, astfel încât să puteți implementa cu ușurință o astfel de soluție pentru site-ul dvs. Vom analiza următorul site: http://www.receita.fazenda.gov.br/PessoaJuridica/CNPJ/cnpjreva/Cnpjreva_Solicitacao2.asp.

Pentru a utiliza această funcționalitate trebuie să aveți propriul cont în serviciul Death by Captcha. Serviciile lor nu sunt gratuite; costul rezolvării a 100 de captchas este de aproximativ 2,89 USD (prețul actual din 28.02.2018).

Rezolvarea captcha are loc automat; trebuie doar să încărcați pagina cu captcha în scraper și să apelați comanda specială captcha_resolve cu anumiți parametri:

prodiver : furnizor de soluții captcha, trebuie să setați valoarea deathbycaptcha.com
tip: tip captcha, trebuie să setați valoarea nocaptchav2
username : numele de utilizator al morții tale prin contul captcha
parola : parola pentru contul tau in sistemul death by captcha

ATENŢIE!!! Pentru ca acest tip de captcha să fie rezolvat cu succes, persoanele care îți vor rezolva manual captcha-ul vor trebui să o facă sub aceeași adresă IP pe care o folosește analizatorul tău. De aceea, singura varianta Pentru a realiza acest lucru, utilizați PROPRIUL SERVER PROXY în configurația dvs. de excavator. Serverele noastre proxy obișnuite nu pot fi accesate de la adrese IP din afara rețelei noastre principale, așa că proxy-urile obișnuite pur și simplu nu vor funcționa în acest caz. În viitor, vom introduce un grup special de servere proxy pentru această sarcină, dar deocamdată va trebui să utilizați propriul proxy.

Codul de bază al analizatorului nostru va fi astfel:

Config: debug: 2 agent: Firefox proxy: PROXY-UL DVS. TREBUIE INSERT AICI faceți: # Vom repeta solicitarea eșuată, așa că vom scrie valoare variabilă, # pe care o va folosi opțiunea de repetare - set_variabilă: câmp: valoare de repetare: "da" # Încărcați pagina cu captcha - mergeți: la: http://www.receita.fazenda.gov.br/PessoaJuridica/CNPJ/cnpjreva /cnpjreva_solicitacao2.asp repetați: faceți: # Rezolvați captcha - captcha_resolve: provider: deathbycaptcha.com tip: nocaptchav2 nume de utilizator: NUMELE DVS. DE UTILIZATOR ÎN SERVICIUL DBC parola: PAROLA DVS. ÎN SERVICIUL DBC

Nu rulați încă analizatorul, doar studiați codul. Dacă captcha-ul este rezolvat cu succes, jetonul va fi stocat în variabila captcha. Prin urmare, primul lucru după rezolvarea captcha este să verificați prezența jetonului în variabilă. Dacă există un token, vom dezactiva opțiunea de repetare și vom transmite token-ul serverului împreună cu ceilalți parametri ai solicitării noastre. Dacă nu există niciun simbol, cererea va fi repetată, deoarece opțiunea de repetare este setată la „da”.

Config: debug: 2 agent: Firefox proxy: PROXY-UL TREBUIE INSERT AICI face: # Vom repeta o solicitare eșuată, așa că vom scrie valoarea variabilei # care va fi folosită de opțiunea de repetare - set_variabilă: câmp: repetare valoare: „da” # Încărcați pagina din captcha - mergeți: la: http://www.receita.fazenda.gov.br/PessoaJuridica/CNPJ/cnpjreva/cnpjreva_solicitacao2.asp repetați: faceți: # Rezolvați captcha - captcha_resolve: provider : deathbycaptcha.com tip: nocaptchav2 nume de utilizator: NUMELE DVS. DE UTILIZATOR ÎN SERVICIUL DBC parola: PAROLA DVS. ÎN SERVICIUL DBC # Accesați blocul body - găsiți: cale: body do: # Citiți valoarea variabilei captcha în registru - variable_get: captcha # Verificați dacă registrul nostru este gol - if: match: \w+ do: # Dacă nu este gol, dezactivați repetarea - variable_set: field: repeat value: "nu" # Transmiteți jetonul și alți parametri site-ului de pe care am colectează informații. # În acest caz, încercăm să obținem informații despre companie prin numărul său de identificare fiscală (CNPJ) - mers: la: post: http://www.receita.fazenda.gov.br/PessoaJuridica/CNPJ/cnpjreva/valida_recaptcha .asp date: origem: comprovante cnpj: 05754558000186 g-recaptcha-response: submit1: Consultar search_type: cnpj do: - find: path: "div#principal" do: - object_new: item - find: path: td:haschild(font) :contains("NÚMERO DE INSCRIÇÃO")) b slice: 0 do: - parse - space_dedupe - trim - object_field_set: object: item field: registration_number - find: path: td:haschild(font:contains("DATA DE ABERTURA") ) b slice: 0 do : - parse - space_dedupe - trim - object_field_set: object: item field: registration_date - find: path: td:haschild(font:contains("NOM EMPRESARIAL")) b slice: 0 do: - parse - space_dedupe - trim - object_field_set: object: item field: company_name - find: path: td:haschild(font:contains("CÓDIGO E DESCRIÇÃO DA ATIVIDADE ECONÔMICA PRINCIPAL")) b slice: 0 do: - parse - space_dedupe - trim - object_field_set : object: item field: primary_code - find: path: td:haschild(font:contains("CÓDIGO E DESCRIÇÃO DAS ATIVIDADES ECONÔMICAS SECUNDÁRIAS")) b do: - parse - space_dedupe - trim - object_field_push: object: item field: secundar_codes - find: cale: td: haschild(font:contains("CÓDIGO E DESCRIÇÃO DA NATUREZA JURÍDICA")) b slice: 0 do: - parse - space_dedupe - trim - object_field_set: object: item field: legal_code - find: path: td: haschild(font:contains("LOGRADOURO")) b slice: 0 do: - parse - space_dedupe - trim - object_field_set: object: item field: street - find: path: td:haschild(font:contains("BAIRRO/DISTRITO" )) b slice: 0 do: - parse - space_dedupe - trim - object_field_set: object: item field: district - find: path: td:haschild(font:contains("MUNICÍPIO")) b slice: 0 do: - parse - space_dedupe - trim - object_field_set: object: item field: municipal - find: path: td:haschild(font:contains("TELEFONE")) b slice: 0 do: - parse - space_dedupe - trim - object_field_set: object: item field: telefon - găsiți: cale: td:haschild(font:contains("E-MAIL")) b slice: 0 do: - parse - space_dedupe - trim - object_field_set: object: item field: email - object_save: name: item

Tehnologia Captcha (CAPTCHA) este un test automat conceput pentru a identifica utilizatorii de mașini, alias roboți.

Scopul lui este să pună o problemă care poate fi rezolvată cu ușurință de un om, dar dificilă pentru un computer.

Dar există și situații în care un script aparent util devine prea intruziv.

Există o presupunere că Google antrenează AI-ul dronelor sale, datorită utilizatorilor care intră în captcha cu imagini. Nu sunt un robot.

Cum să elimin captcha Nu sunt un robot

Motivele acestui comportament pot varia, dar puteți încerca oricând să remediați totul - efectuăm acțiuni pe măsură ce apar excepții:

  • Deconectați și reconectați conexiunea activă la Internet. Reporniți routerul sau modemul. Prin urmare, adresa IP se poate schimba.
  • Apelăm la utilizarea unui serviciu VPN. Acestea din urmă sunt atât plătite, cât și pentru utilizare gratuită. Acestea sunt furnizate sub formă de extensii (suplimente) pentru browsere și ca software instalat separat pe un computer.
  • Ne uităm prin și extensii instalate. De exemplu, cea mai recentă versiune a lui Yandex.Browser în sine dezactivează pluginurile din surse neverificate și verifică periodic pe cele deja instalate pentru falsuri.
  • Verificați dacă JavaScript este activat în browserul web: Setări → Afișare setari aditionale→ bloc de date personale Setări de conținut → secțiune JavaScript.
  • Să nu uităm de programe antivirus– poate că computerul a devenit victima unui botnet, de aici și nemulțumirea față de CAPTCHA pentru traficul generat la această adresă.

Interesant este că sute de milioane de captch-uri sunt introduse de utilizatorii de internet în fiecare zi. Nu este un secret pentru nimeni că nu toată lumea reușește să o introducă corect prima dată.

Nu cu mult timp în urmă, Google a completat funcționalitatea ReCaptcha v2 cu un captcha invizibil.
O mostră din aceasta poate fi văzută la acest link:
https://www.google.com/recaptcha/api2/demo?invisible=true

Acum, de multe ori, utilizatorul nici măcar nu trebuie să dea clic pe caseta de selectare „Nu sunt un robot”; captcha-ul în sine apare într-un strat invizibil, deplasat suplimentar cu 10.000 px deasupra partea de sus a paginii și nu este vizibil pentru utilizator. Trecerea captcha începe doar în momentul depunerii formularului. Dacă cookie-urile utilizatorului sunt bune, atunci nici nu va observa că a existat un captcha. Dacă cookie-urile nu sunt foarte bune, atunci când trimite formularul va primi imediat o recaptcha standard în centrul ecranului, unde trebuie să selecteze mai multe imagini.

În general, principiul de funcționare al recapthca nu s-a schimbat deloc, dar unii clienți ai serviciului de site web au întâmpinat probleme. Dacă în munca ta generezi o solicitare POST care conține „g-recaptcha-response” către site-ul pe care este instalat captcha, atunci nici măcar nu vei observa modificările. Problema a apărut printre acei clienți care folosesc un motor de browser pentru a automatiza orice acțiuni, de exemplu silenium.

Ce ar trebui să fac pentru a activa Invisible ReCaptcha în browserul meu?
1) Decupați div-ul care conține recaptcha din corpul documentului:

2) Tăiați întregul bloc

var onSuccess = function(raspuns) ( var errorDivs = document.getElementsByClassName("recaptcha-error"); if (errorDivs.length) ( errorDivs.className = ""; ) var errorMsgs = document.getElementsByClassName("recaptcha-error-messaj "); if (errorMsgs.length) ( errorMsgs.parentNode.removeChild(errorMsgs); ) document.getElementById("recaptcha-demo-form").submit();

3) Introduceți următorul cod:
%g-recaptcha-response%

În care %g-recaptcha-response% este codul pe care l-ați primit de la 2captcha.com

4) Veți avea un buton „Trimiteți interogarea”, când faceți clic pe el veți trimite toate datele formularului și g-recaptcha-response către site-ul unde este instalat captcha

În acest mod simplu, transformăm Invisible ReCaptcha într-un ReCaptcha V2 obișnuit și îl transmitem.

Și acei dezvoltatori care nu emulează browserul, dar trimit imediat solicitări POST, nici nu vor observa dacă recaptcha se schimbă în invizibil.