Většina mladých má v jeho věku úplně jinou zábavu. Michal Bravanský chce ale co nejlíp využít čas na střední škole, aby si v praxi vyzkoušel, co ho nejvíc baví, a mohl si podle toho vybrat správnou životní dráhu. Jak sám říká, střední škola je nejlepší období pro rozvoj a budoucí nasměrování kariéry. Zatímco na základní škole žáci nemají dost znalostí, aby se mohli sami realizovat, na vysoké zase stráví spoustu času učením. On je navíc soutěživý a když mu něco jde, snaží se v tom rozvíjet. Proto vzal svůj projekt, spojil se s týmem profíků v Seznamu a spolu s nimi čtvrt roku testoval nový způsob shlukování článků v rámci seznamáckého doporučování. Je tedy možné, že až si na největším českém webu budete číst zajímavý článek, tak vám právě díky práci Michala Bravanského doporučí další nejvhodnější texty na podobné téma.
Jakou školu studuješ a co tě baví ve volném čase?
Bydlím v Bílovci, kde také studuji na Gymnáziu Mikuláše Koperníka. Po prázdninách nastupuji do předposledního ročníku střední školy. Volný čas trávím často programováním a sebevzděláváním. Také pracuji na různých projektech jako freelancer. Podílím se mimo jiné na organizaci mezinárodní soutěže Expedice Mars. Výhrou této soutěže pro středoškoláky je stohodinový simulovaný let na Mars a registrace jsou pořád otevřené.
Odkud ses o možnosti stáže v Seznamu dozvěděl?
Poslední půl rok jsem pracoval na vlastním projektu Měj Přehled, což je automatický zpravodaj na sociálních sítích, se kterým jsem nakonec vyhrál celostátní kolo letošní Středoškolské odborné činnosti. Díky němu jsem začal dělat s technologiemi, které teď používám i v Seznamu. Chtěl jsem najít pro celý tento projekt další využití, a tak jsem se spojil se zdejšími výzkumníky a ti mi dali možnost stát se součástí jejich týmu.
Na čem jsi za tu dobu v Seznamu pracoval?
V Seznamu implementuji svůj projekt Měj Přehled. Pracuji s internetovými články, z nichž vytvářím „shluky”, kde jednotlivé články popisují stejné téma. S tímto systémem lze u jednoho zpravodajského článku doporučit další na úplně stejné téma, ale třeba z jiného zdroje. K dosáhnutí takových výsledků využívám sent2vec, v Seznamu zatím neodzkoušenou technologii, a vlastní shlukovací algoritmus. Na projektu tedy pracuji sám, ale za velké pomoci celého týmu výzkumu.
Jaké máš s analýzami zkušenosti?
Velice malé, většinu analýz jsem si předtím prováděl pouze doma sám. A samozřejmě, v Seznamu jsou o hodně vyšší standardy. Tady musí všechno řádně projít review, kód musí být co nejvíce čitelný a optimalizovaný. Za dobu mojí stáže v Seznamu jsem se ve standardech hodně posunul a chystám se je začít aplikovat i na svých budoucích projektech.
Jaké metody používáš?
Analyzuji témata zpravodajských článků, kdy jsem si nejdříve natrénoval vlastní FastText model vycházející z word2vec a umožňující reprezentovat články jako několika dimenzionální vektor. Články poté shlukuji. Používám k tomu vlastní shlukovací algoritmus vycházející z DBSCAN, kdy neberu v potaz jenom vektory článků, ale také čas jejich vydání.
Co má být cílem analýzy a k čemu se využije?
Cílem je nejprve ověřit, že tento systém může dobře fungovat, a pohrát si s jeho parametry tak, aby byl co nejpřesnější. Podle toho, jak moc se osvědčí, může být implementovaný na domovskou stránku Seznamu i na další místa, na kterých Seznam doporučuje články. Také je zajímavá samotná technologie word2vec, díky které lze články velice přesně porovnávat mezi sebou.
Co tě na tom baví?
Mohl jsem použít svůj vlastní nápad ohledně shlukování článků. A dostal jsem příležitost ho testovat a zdokonalovat. Nemusel jsem pracovat na projektech, které mi nejsou tak blízké.
Jaký je tvůj profesní sen?
Mým snem je někdy v budoucnu vzít dobrý nápad a vytvořit z něho fungující startup. Postupně, jak si zkouším pracovat na plný úvazek, si začínám uvědomovat, že možná nechci mít přesnou pracovní dobu od 9 do 17 hodin do konce života. Ale na to mám ještě hromadu času, takže to moc neřeším.
Rád bych Vám, Michale Bravanský, poslal větší text. Můžete mě kontaktovat na toskazavináčtiscali.cz ?
Děkuji,
Přeji pěkný den,
Josef