Congress Edits

I read an article mentioning that about 8.5% of Twitter accounts are automated.

One particularly interesting example is @congressedits (https://twitter.com/congressedits) which sends tweets whenever someone edits Wikipedia content from IP addresses belonging to the US Congress.

Great way to monitor the media and to detect any potential manipulation. It seems to me such initiatives will become more popular and important in the nearest future.

Akty prawne

Czas na pierwszą wizualizację. Zaczynamy od liczby aktów prawnych wydanych w Polsce na przestrzeni kolejnych dekad.

Dane źródłowe pochodzą z Internetowego Systemu Aktów Prawnych, który znajduje się na stronach Sejmu. Baza zawiera wszystkie akty od 1918 roku. Prawie wszystkie dokumenty to PDF-y (choć starsze to skany a nie tekst). Ogólem jest ok. 67 tys. aktów, 74 tys. PDF-ów (niektóre akty mają różne typy teksów), które zajmują ~ 19GB.

akty1
[zobacz wykres w nowym oknie]

Pierwszy rzut oka zdaje się potwierdzać tezę, że produkuje się coraz więcej “prawa”. W ostatnich latach jest istotny wzrost, szczególnie gdy spojrzymy na liczbę stron a nie liczbę dokumentów. Jako laik z tej dziedziny byłem też trochę zaskoczny, że np. w latach 20 i 30 wytworzono tak mało dokumentów w porównaniu z ostatnią dekadą. Podejrzwałbym, że na początku II RP było więcej pilnych kwestii do rozwiązania. Ciekawie by było porozmawiać z ekspertem. Czy rzeczywiście jest uchwalane teraz coraz więcej prawa, które jest coraz mniej istotne? Czy może mamy coraz więcej dziedziń, które są uregulowane?

Ten wykres to także moje pierwsze poważniejsze próby z d3js. W dwóch słowach, d3js to javascriptowa biblioteka, która umożliwa tworzenie dokumentów/wizualizacji opartych na danych (Data Driven Documents). Podejście deklaratywne pozwala dość zwięźle opisać dokument. Dzięki temu wykres taki jak wyżej zajał ok. 300 linii kodu (choć czytelność stawiałem nad zwięzłość i do javascript ninjy bardzo mi daleko).

Z d3js pierwszy raz zetknąłem się już jakiś czas temu, ale dotychczas nie miałem okazji nigdzie tego wykorzystać. Ucieszyłem się, że ostatnio pojawiło się więcej tutoriali i przykładów, jak chociażby na stronie głównej projektu, czy tutaj. W d3js podoba mi się szczególnie to, że można dość niewielkim kosztem uzyskać wykres/grafikę, która wszędzie się uruchomi (HTML+js) i jest self-contained (jeśli danych nie ma dużo możemy wrzucić je bezpośrednio do javascriptu. Poza tym łatwo jest dodać elementy interaktywne, co od razu przykuwa uwagę. Mam nadzieję, że wkrótce będę mógł się pochwalić kolejnymi rezultatami.