LJSear.ch - storitev za tiste, ki potrebujejo datoteke "Live Journal"
Spletne Storitve / / December 24, 2019
Želite, da bi našli v "učenja" stoletni zapisa, vendar ne more, ker so možnosti iskanja omejena na en mesec? Boste brezplačno storitev LJSear.ch, Ki vsebuje arhiv rusko-jezika LiveJournal za obdobje 2000-2015. Govoriti o tem njen ustvarjalec Roman Ivanov (kukutz).
Roman Ivanov
Produktni vodja v "Yandex". Je sprožila iskanje blog, osebno iskanje "Yandex", več različic "Yandex. Poštne "storitve" Yandex. Lenta "," Ya.ru "," Yandex. Slike "in številne druge. To se zdaj ukvarja z "Yandex. Browser "in LJSear.ch.
Kaj je LJSear.ch?
"Več o tem" To je več kot terabajt arhivov. Indeksirane in je na voljo za iskanje 340 milijonov objave in komentarje 1 milijardo od leta 2000 do jeseni 2015. In vse to z znano blog iskalniki: Omejitev po avtorju, po datumu, ki ga je skupnost.
Novi vnosi niso indeksirane, saj menimo, da naš projekt kot arhiv, spominska.
Projekt je v celoti je neprofitna, ne oglaševanje, in druge načine, da bi denar ni namenjen.
Zakaj moram storitev?
V jeseni leta 2015, možnost iskanja po blogih "Yandex" so bili omejeni le na prejšnji mesec. Razlaga je preprosta: velika večina ljudi, ki iščejo
informacijePovezana z nedavnimi evidenc, in globoko iskanje za njih je odveč.Res je. Prejšnji mesec je dovolj za naloge, kot so redno spremljanje ali iskanje nečimrnosti pregledov nekaterih nedavnih dogodkov. Vendar pa je problem in globlje raziskovanje.
Verjamem, da je v "Več o tem," se je zgodilo, ali vsaj se je odrazilo skoraj vse rusko govoreče kulture nič let. Vrednost tega arhiva ni mogoče preceniti. Če ima "Yandex" zaprto iskanje arhiv, sem zelo razočaran, saj je prepričan, da je treba ta zbirka podatkov hranijo za človeštvo. No, in sem vprašal, "Yandex" arhive, in je nenadoma strinjal in jih dal.
Arhiv Blog precej edinstven, ker toliko ni mogoče prenesti v "Več o tem". Številne revije se odstranijo z njihovih avtorjev, nekateri pokvarjeni in uniči hekerji, v nekaterih primerih, zapisi niso izbrisani, ampak skrita pod ključem.
V zadnjih šestih mesecih na I je bila odgovorna za zagotavljanje, da se podatki ne izgubijo. Sem poklical na pomoč prijateljev, med njimi pa so bili tisti, ki so se strinjali, da pomoč razumeti, ali mi lahko na podlagi razpoložljivih informacij za iskanje. Ustvarili smo storitev LJSear.ch in ga očitno odpeljal v stanje Pameten.
Prostovoljci so bili mnogi?
So bile ugotovljene. Znani strokovnjak na področju UX Kohl Zayarny Sem prišel z načrtovanjem. Sasha Belyanskiy Vzel sem BEM-vorstku in frontend na Node.js. Spaceinvaderz ukvarja sistemsko dajanje. Hrbtenica programiranje v PHP I se je začela na podlagi samega prototipa, ki je moje prijatelja dejavnika.
Največji problem je bil železo: kdo bo plačal za gostovanje? Prijatelji prepričani, da lahko zbira denar za kraudfandingovyh mestih, vendar sem bil skeptičen. In tam so čudoviti ljudje prišli k nam iz Servers.ru in ponudili pomoč. Kot rezultat, imamo veliko namenskega strežnika z SSD za indeksiranje in iskanje backend plus oblak virtualni strežnik na pročelje.
Kdo lahko zainteresirani v projektu?
Ker so nove zapise ne indeksirajo, občinstvo, ki domnevam - so raziskovalci. Kako dobesedno raziskovalci kulturne plasti nič let, in sedanji ali nekdanji uporabniki "Več o tem", ki želijo, da bi našli nekaj, kar je bilo napisano v teh letih. In ker nisem omeji na maksimalni čas izvršitve iskanja: preiskovalec lahko počaka za kompleksne poizvedbe in minuto in dve. Seveda, so enostavne poizvedbe hitro izvrši, in če storitev zazna, da je vprašanje zdaj veliko, vključuje nadzorovano razgradnjo, vključno z omejitvami časovne omejitve zahtevo.
LJSear.ch →