Jak jsem psal v posledním článku, začal jsem trošku programovat v Pythonu.
Už asi před 8 lety jsem začal dělat hodnocení zpráv, nyní v tom pokračuji, resp. celé jsem to přepsal do Py (resp. ještě ne celé, ale už mám tak půlku :) )
Prostě - žere to zprávy z RSS zdrojů, rozebírá je to na jednotlivá slova, ty pomocí Natural Language Processingu převádí na stejný tvar a z něj pak počítá počty.
Je to zajímavé, dají se z toho vysledovat pěkné trendy, ukázkou je následující tabulka.
Jasně dominuje koronavir, ale dají se vysledovat i další slova, spíš mě zajímá ta technologie, ale dřív nebo později to vyvedu i na web.
10.04.2020 | 11.04.2020 | 12.04.2020 | 13.04.2020 | 14.04.2020 | 15.04.2020 | 16.04.2020 | 17.04.2020 |
koronavir | který | koronavir | koronavir | koronavir | který | koronavir | koronavir |
člověk | koronavir | který | který | který | koronavir | který | který |
nebýt | člověk | člověk | podle | podle | podle | podle | podle |
český | sobota | podle | člověk | člověk | kvůli | Praha | vláda |
Koronavir | podle | Praha | počet | kvůli | opatření | kvůli | kvůli |
Rusko | týden | opatření | pandemie | vláda | vláda | Česko | člověk |
podle | tisíc | neděle | poslední | Praha | Praha | člověk | opatření |
Česko | případ | pandemie | kvůli | pandemie | český | opatření | koruna |
opatření | nebýt | nemocnice | nakažený | český | Česko | český | duben |
počet | pandemie | vláda | další | opatření | člověk | další | počet |
kvůli | hodně | český | opatření | procent | ministerstvo | pandemie | nemocnice |
hodně | kvůli | nebýt | Praha | Česko | duben | milion | zákon |
tisíc | vláda | počet | hodně | ministerstvo | další | ministerstvo | Praha |
pandemie | český | kvůli | prezident | březen | pandemie | nebýt | český |
deset | nemoc | Zeman | týden | týden | americký | senát | procent |
Koněv | ministr | nákaz | covid-19 | další | hodně | čtvrtek | další |
vláda | měsíc | týden | případ | hodně | škola | vláda | první |
karanténa | počet | velikonoční | tisíc | úterý | případ | americký | květen |
svátek | některý | hodně | americký | obchod | první | chtít | senát |
duben | opatření | Česko | český | počet | počet | počet | Babiš |
0 komentářů:
Okomentovat