Przeprawa z Google Sitemaps dla Qlweba

Przerobiłem na płatny kolejny swój katalog. W zasadzie powinienem zacząć przechodzenie na płatne od tego właśnie katalogu, bo nie jest to moj “kolejny katalog stron” a pierwszy, sztandarowy katalog Bielack no.1. Katalog który mam już ponad rok, kataloguję go stale, dmucham, chucham i w ogóle moderuję. Na płatny przerobiłem z tego samego powodu co i inne swoje katalogi - ile można odrzucać śmietniki? Rok mi wystarczył i poddałem się. Teraz, zamiast setki wpisów dziennie mam jeden. Ale z setki zatwierdzałem pięć, czasami dziesięć.

Ile czasu poświęca sie na moderację śmietników wie tylko ten, kto przez rok moderował katalog z PR4.

Mój katalog miał PR4, ale przy ostatnim PR update zabrali 4 i zostawili 3. Być może dlatego, że podpiąłem pod niego dwa systemy linkujące.
Przy przejściu na tryb płatny, rzecz jasna, usunąłem wszystkie zbędne linki, by zapewnić jak najlepszą PresselPage dla wpisujących. Zostały tylko dwa linki - Spis katalogów Mara i GlobalWarming (pomagam koledze w tymże konkursie). W maju usunę nawet te dwa.
Ale nie o tym miał być ten wpis, choć wstęp może tak sugerować.

Klasyczny katalog na skrypcie Qlweb można teraz w stosunkowo prosty sposób przerobić na “by Jachu”: wystarczy ściągnąć pliki katalogu, załadować je na serwer w miejsce starych i uruchomić plik “upgrade.php”. W zasadzie tyle, ciekawych odsyłam na stronę twórcy skryptu “by Jachu” po dokładniejsze wskazówki i szczegóły tej operacji.
Po Upgrade mamy wiele dodatkowych opcji do wyboru, a niektóre z opcji już istniejących - działają trochę inaczej. Tak jest z mapą katalogu w formacie XML przeznaczoną dla Google. Mapa generuje się bez problemu i jeśli mamy katalog świeży, i wszystkie wpisy dodawane sa przez skrypt “by Jachu” nie ma z nią najmniejszych problemów. Ale - jeśli mamy katalog po upgrade, jak mój Bielack no.1 właśnie, zaczynają się schody.
Google na stronie dla webmasterów co chwilkę krzyczy o błędach w mapie:
błędy w sitemapsZaczęło się już od linii 135, gdzie jakimś cudem udało się przemycić literkę “ś” do arkusza xml mapy. Poprawiłem. Wygenerowałem ponownie mapę i ponownie zgłosiłem do wielkiego G. Dwadzieścia wierszy dalej był kolejny błąd, którego nie dopatrzyłem. Zrobiłem wszystko to, co wyżej. I jeszcze raz. I kolejny.
Fajnie, że komunikat błędu pokazuje konkretną linię z błędem, więc od razu wiadomo, gdzie szukać. Jednak nie jest aż tak różowo; Przy którymś z kolei komunikacie, próbowałem doszukać się we wskazanej linii jakiejś nieścisłości - i nie mogłem. Zapytałem Wiedzącego lepiej, ten odpowiedział mi - To może być błąd w sąsiednich liniach, bo masz ich tam kilka. Faktycznie, poprawiłem te sąsiednie linie ze znaków zapytania “?” w treści i poszło dalej.

Takich przypadków miałem chyba setkę - każdy raz musiałem od nowa wykonać te same czynności. Poprawiłem stosowne zapisy w pliku class/usefull.php gdzie są translacje znaków użytych do tworzenia adresu. Mimo wszystko, dalej, coś, gdzieś nie pasowało. W przypadku z obrazka za pierwszym razem w linii 4439 był zapis:

http://www.katalog.bielack.pl/ksiazka,telefoniczna,cd,
ksiazka,telefoniczna,ebook-info-792.html

Nie byłem w stanie doszukać się tutaj błędu, dlatego analizowałem wiersze sąsiednie. Znalazłem coś, co mogło uchodzić za błąd, poprawiłem, wygenerowałem mapę ponownie, załadowałem na serwer i zgłosiłem ponownie. Po kwadransie w panelu od Sitemapy w Googlu znów było czerwono - Błąd. Znów w linii 4439. A tam znów ta sama linia z tym samym linkiem. Link, po wklejeniu do przeglądarki, rzecz jasna, wyświetlał się prawidłowo. (Potem usunąłem kilka innych linków, dlatego link z przykładu już nie działa.)

Szlag mnie trafia, ale co robić - chcesz mieć sprawną sitemapę - sobie na nią zapracuj.
——-
Po całym dniu walki udało mi się osiągnąć sukces i wielkie G. przyjęło w całości mapę mojego nowego katalogu stron w całości i bez komunikatów błędu. O godzinie 22 zassało mapę i w końcu zobaczyłem zielone światło: OK. Liczba zgłoszonych adresów URL: 4892
Teraz czekam na ponowną indeksację.

Inne moje wpisy o podobnej tematyce:

Tagi dla tego wpisu:

(wymagane)

(wymagane)