Google Hacking

18 lutego 2010, swamper

Google Hacking to technika wykorzystywania wyszukiwarki Google, która zwraca informacje przydatne przy analizie bezpieczeństwa innych stron WWW.

Dowiesz się:

Google Sztu(cz)ka

Wyszukiwarka Google co jakiś czas indeksuje strony WWW. Indeksuje, czyli odwiedza daną stronę, po czym zapisuje ją, żeby w przyszłości móc ją wyświetlić jako wynik wyszukiwania. Warto zwrócić uwagę, że Google nie trzyma jedynie adresu do strony. Przechowuje on całą zawartość strony.

Schemat

Ba, nawet więcej – trzyma jej kopie przez pewien czas. Te archiwalne kopie fachowo nazywane są: cache, pamięć podręczna. Zobaczmy jak działa nasz pierwszy, rozgrzewkowy Google Hack:

cache:jakilinux.pl

Proste, a czasem bardzo przydatne. Np. jeśli jakiś link nie działa (bo strona się zawiesiła, albo ktoś specjalnie coś usunął), to i tak możemy podejrzeć archiwalną zawartość.

Ludzka głupota

Tylko dwie rzeczy są nieskończone: wszechświat oraz ludzka głupota, choć nie jestem pewny co do tej pierwszej.

Albert Einstein

Zdziwiłbyś się, ilu ludzi po prostu udostępnia swoje hasła, gorzej – nie tylko swoje. Tak zwanym Google Dorks zdarza się udostępnić: listy haseł, zbiory z numerami kart kredytowych, adresy domyślnych interfejsów konfiguracyjnych, albo inne parametry mające znaczenie dla zabezpieczeń danej strony. Dzięki temu, przez określenie odpowiednich słów kluczowych oraz innych parametrów wyszukiwania, napastnik może mniejszym niż zwykle nakładem pracy dokonać prób ataku na nieprawidłowo zbudowane serwisy. Równocześnie jednak, zapytania takie mogą stanowić znaczną pomoc dla administratorów witryn i uprawnionych audytorów zabezpieczeń.

Przykład: Dzienniki zdarzeń serwera (tzw. logi) zawierające informacje dotyczące konta administratora, w tym nazwę użytkownika i hasło.

admin account info filetype:log

Około 309 wyników w 0,12 s.

Piękny przykład: Kamerki (czasem nawet ruchome). Nie zawsze się uda, ale jeśli znajdziemy jakiś ciekawych ludzi to mamy własny Big Brother Show.

camera linksys inurl:main.cgi
liveapplet
live view – axis
inurl:jview.htm

Oczywiście, przykłady można by mnożyć w nieskończoność. Jednak więcej korzyści da, jeśli Czytelnik sam zacznie szukać, eksperymentować, do czego gorąco zachęcam. Zacząć można od największej bazy Google Hacków – GHDB: Google Hacking Database. Kiedyś była łatwo dostępna, dziś trzeba się zarejestrować, żeby zobaczyć całe to dobrodziejstwo, ale na szczęście za darmo (póki co… spieszcie się!).

Cześć, nazywam się Google, też mam 12 lat

Istnieją strony, do których nie masz dostępu, natomiast Pan Google ma. Sprawa z pewnością jest irytująca, gdy kiedyś miałeś taki dostęp, a teraz nie. Często tak dzieje się na forach albo portalach z informacjami, gdzie widzimy tylko wstęp do artykułu. Kiedy klikamy na „pokaż więcej” to np. każą płacić SMS-em, zarejestrować się czy robić inne niepotrzebne rzeczy. Ale Google często „widzi”, te strony w całości, tzn. ma do nich pełny dostęp.

Jest prosty sposób, aby takie strony „myślały”, że to my jesteśmy pajączkiem Google’a… Czym?
Pajączek Google’a to inaczej mówiąc Googlebot, spider, bot, crawler. Tak naprawdę to po prostu bezmyślny program (najczęściej napisany w języku C), który „udaje” internautę. „Surfuje” po internecie i zbiera informacje o stronach WWW.

I taki pajączek Google’a może za darmo oglądać wszystko, a my nie? A więc do dzieła. W przeglądarce Firefox na pasku adresu wpisujemy:

about:config

Na liście wyszukaj parametr general.useragent.extra.firefox. Kliknij na niego dwukrotnie. Wpisz nową wartość:

Googlebot 2.1

Żeby przywrócić ustawienia, kliknij ten sam parametr prawym przyciskiem i wybierz Resetuj/Restartuj.

Jak się bronić?

Najprostszy sposób: Załóżmy, że mamy np. forum. Chcemy mieć święty spokój, żeby żadne prywatne wiadomości (posty) nie „wyciekły” do sieci poprzez Google. Albo, żeby nikt nie kombinował (jak my powyżej ;) z podszywaniem się pod Googleboty (pajączki). Możemy storzyć plik robots.txt. Umieszczamy go w głównym folderze, obok index.html/index.php. W robots.txt wpisujemy dwie magiczne linijki:

User-agent: *
Disallow: /

Co znaczy, że żaden pajączek (bot) nie ma tu prawa wstępu i nigdy nie wejdzie i nic nie zaindeksuje. Dokladniej opisany plik robots.txt jest np. : tutaj.

To wszystko. Starałem się w jak najbardziej zjadliwy dla Czytelnika sposób podać wszystko, co aktualnie wiem na temat Google Hackingu. Mam nadzieję, że to mi się udało. Dziękuje za lekturę.

Autor: Adam Stelmaszczyk, Student Informatyki na Politechnice Warszawskiej
Skład: Swamper

Podziel się na:

  • del.icio.us
  • Facebook
  • Google Bookmarks
  • Śledzik
  • Blip
  • Identi.ca
  • Kciuk.pl
  • Wykop

Ten artykuł został napisany w ramach konkursu na artykuł o bezpieczeństwie IT zorganizowanego przez wortal jakilinux.org oraz firmę Securitum, organizatora szkoleń z bezpieczeństwa IT.

Securitum

Creative Commons License

Tekst opublikowany jest na licencji Creative Commons Uznanie Autorstwa 2.5, co w skrócie oznacza, że możesz go dowolnie modyfikować, publikować i rozpowszechniać również dla użytku komercyjnego. Jeśli skorzystasz z tego tekstu prosimy Cię jedynie o link zwrotny do wortalu jakilinux.org oraz strony securitum.pl i informację o autorze oraz o tym, że został on pierwotnie opublikowany w naszym serwisie.


Komentarze (RSS)

Komentarze są prywatnymi opiniami dodających je osób. Prosimy o zachowanie kultury wypowiedzi. Komentarze obraźliwe oraz obniżające poziom serwisu będą usuwane. Więcej w regulaminie komentowania.

Liczba komentarzy: 13

zwiń wątek Gentoolx  18 lutego 2010 o godz. 20:46 # Zwiększ karmę Zmniejsz karmę Cofnij swój głos Zgłoś komentarz do usunięcia KARMA: +6 [Pokaż komentarz]

Co do pliku robots.txt to chciałbym zauważyć, że niekoniecznie musi być on egzekwowany przez robota, szczególnie jeśli chodzi o inne wyszukiwarki.

 
zwiń wątek robb  18 lutego 2010 o godz. 21:05 # Zwiększ karmę Zmniejsz karmę Cofnij swój głos Zgłoś komentarz do usunięcia KARMA: +5 [Pokaż komentarz]

Chcę zwrócić uwagę, że plik robots.txt w żaden sposób nie blokuje dostępu do strony dla botów. Służy on jedynie jako wskazówka i tylko od konkretnego bota zależy, czy się do niej zastosuje, czy nie. Kulturalne boty, jak np. Googlebot się do tego zastosują, jednak spamboty już niekoniecznie.

 
zwiń wątek karolcia  19 lutego 2010 o godz. 20:31 # Zwiększ karmę Zmniejsz karmę Cofnij swój głos Zgłoś komentarz do usunięcia KARMA: +4 [Pokaż komentarz]

Ciekawy artykuł.
Co do kopii stron to polecam: http://www.archive.org
może się przydać jeśli oryginalna strona padnie, a są nam potrzebne jakieś informacje.

można zobaczyć np. jak wyglądała serwis w 2005 r.
web.archive.org/web/*/jakilinux.org

 
zwiń wątek Speaktrap  27 lutego 2010 o godz. 17:29 # Zwiększ karmę Zmniejsz karmę Cofnij swój głos Zgłoś komentarz do usunięcia KARMA: +2 [Pokaż komentarz]

Fajny artykuł =) No i nikt (jak na razie) do niczego się nie przyczepia

zwiń wątek michuk  27 lutego 2010 o godz. 18:09 # Zwiększ karmę Zmniejsz karmę Cofnij swój głos Zgłoś komentarz do usunięcia KARMA: +2 [Pokaż komentarz]

To faktycznie dość niesamowite :>

 
zwiń wątek karafior  2 marca 2010 o godz. 21:36 # Zwiększ karmę Zmniejsz karmę Cofnij swój głos Zgłoś komentarz do usunięcia KARMA: -2 [Pokaż komentarz]

Zasadniczo mógłbym się przyczepić że podobny artykuł był w PCWorld 4 lata temu… [;

 
 
zwiń wątek gidgnulur  27 lutego 2010 o godz. 20:09 # Zwiększ karmę Zmniejsz karmę Cofnij swój głos Zgłoś komentarz do usunięcia KARMA: +3 [Pokaż komentarz]

Ale jaja z tymi kamerkami. ;)

zwiń wątek Anon  1 marca 2010 o godz. 1:32 # Zwiększ karmę Zmniejsz karmę Cofnij swój głos Zgłoś komentarz do usunięcia KARMA: 0 [Pokaż komentarz]

Kamerki można znaleźć pod tymi frazami w googlu:
* inurl:”CgiStart?page=”
* inurl:/view.shtml
* intitle:”Live View / – AXIS
* inurl:view/view.shtml
* inurl:ViewerFrame?Mode=
* inurl:ViewerFrame?Mode=Refresh
* inurl:axis-cgi/jpg
* inurl:axis-cgi/mjpg (motion-JPEG) (disconnected)
* inurl:view/indexFrame.shtml
* inurl:view/index.shtml
* inurl:view/view.shtml
* liveapplet
* intitle:”live view” intitle:axis
* intitle:liveapplet
* allintitle:”Network Camera NetworkCamera” (disconnected)
* intitle:axis intitle:”video server”
* intitle:liveapplet inurl:LvAppl
* intitle:”EvoCam” inurl:”webcam.html”
* intitle:”Live NetSnap Cam-Server feed”
* intitle:”Live View / – AXIS”
* intitle:”Live View / – AXIS 206M”
* intitle:”Live View / – AXIS 206W”
* intitle:”Live View / – AXIS 210″
* inurl:indexFrame.shtml Axis
* inurl:”MultiCameraFrame?Mode=Motion” (disconnected)
* intitle:start inurl:cgistart
* intitle:”WJ-NT104 Main Page”
* intitle:snc-z20 inurl:home/
* intitle:snc-cs3 inurl:home/
* intitle:snc-rz30 inurl:home/
* intitle:”sony network camera snc-p1″
* intitle:”sony network camera snc-m1″
* site:.viewnetcam.com -www.viewnetcam.com
* intitle:”Toshiba Network Camera” user login
* intitle:”netcam live image” (disconnected)
* intitle:”i-Catcher Console – Web Monitor”

 
 
zwiń wątek kleer94  1 marca 2010 o godz. 14:26 # Zwiększ karmę Zmniejsz karmę Cofnij swój głos Zgłoś komentarz do usunięcia KARMA: -4 [Pokaż komentarz]

Jeden z najciekawszych artykulów, jakie znalazlem.
Pierwsze slyszę, że google ma take uprawnienia.

 
zwiń wątek grafzero  3 marca 2010 o godz. 16:16 # Zwiększ karmę Zmniejsz karmę Cofnij swój głos Zgłoś komentarz do usunięcia KARMA: 0 [Pokaż komentarz]

robots.txt ma dwie twarze – tą złą jest to, że nie trzeba go “posłuchać” (jak wspomniano we wcześniejszych komentarzach) i jeśli podamy np: disallow /secret to będzie to wskazówka dla innych botów gdzie najlepiej szukać

 
zwiń wątek krzabr  3 marca 2010 o godz. 20:49 # Zwiększ karmę Zmniejsz karmę Cofnij swój głos Zgłoś komentarz do usunięcia KARMA: 0 [Pokaż komentarz]

Warto też zobaczyć w people searchach informacje o nas samych , można się sporo dowiedzieć ….

 
zwiń wątek tommat  29 marca 2010 o godz. 7:22 # Zwiększ karmę Zmniejsz karmę Cofnij swój głos Zgłoś komentarz do usunięcia KARMA: 0 [Pokaż komentarz]

Co do tych haseł to trochę przesada, podane zapytanie prowadzi do logów z teamspeaka, teamspeak podczas pierwszego startu generuje haslo admina i wklada je do logu, zadaniem administratora jest je znalezc i zmienic, nie widzę nic zdrożnego w publikowaniu tego typu logów dopóki admin zmienia hasło po pierwszym logowaniu. Poza tym po co komu dostep do serwera teamspeak?

 
zwiń wątek 443citroen_fan  17 czerwca 2010 o godz. 13:59 # Zwiększ karmę Zmniejsz karmę Cofnij swój głos Zgłoś komentarz do usunięcia KARMA: 0 [Pokaż komentarz]

dzięki za świetny artykuł ;]

 
Identyfikator (wymagane)
Adres e-mail (wymagany - nie pokażemy go publicznie)
Adres URI
Rozmiar pola: zmniejsz rozmiar | zwiększ rozmiar
Uwaga! Niektóre komentarze, m.in. te dodane przez niezalogowanych i nowych użytkowników, są ręcznie moderowane. Jeśli Twój komentarz nie ukaże się od razu, nie dodawaj go ponownie, tylko cierpliwie poczekaj na akceptację.

Literówki najlepiej zgłaszać jabberem: michuk@jakilinux.org lub kocio@jabber.org!

W komentarzach możesz używać prostych znaczników HTML. Przykłady:
  • Link: <a href="jaklinux.org">Linux dla każdego</a>,
  • Wytłuszczenie: <strong>tekst pogrubiony</strong>,
  • Kursywa: <em>tekst pochylony</em>,
  • Przekreślenie: <strike>tekst przekreślony</strike>,
  • Kod: <code>printf("blok kodu");</code>,
  • Cytat: <blockquote>cytat</blockquote>
Uwaga: jeśli dodasz nieznany znacznik, będzie on niewidoczny, gdyż system filtruje takie znaczniki.

Branżowe oferty pracy

Reaklmy AdTaily

RSS

Możesz śledzić komentarze do tego artykułu poprzez specjalny kanał; RSS 2.0 .

Porównaj dystrybucje!

vs

Dołącz do nas!

Masz ulubioną dystrybucję? Chciałbyś zostać jej opienkunem w wortalu jakilinux.org? Nic prostszego!
Więcej o współpracy na blogu Grupy Jakilinux.

Butik JL

jakilinux butik
Obejrzyj więcej produktów i wybierz coś dla siebie.

Subskrybuj Biuletyn!

Biuletyn Grupy Jakilinux to okresowy subiektywny przegląd najważniejszych informacji o których piszemy w naszych serwisach, który wysyłamy e-mailem. Subskrybuj biuletyn!