DataSkop
Was passiert mit meinen Daten?
@textungen @medialepfade medialepfade.org
Robert Behrendt
Überblick
Überblick
Für inklusive Pädagogik und Potentialentfaltung,
1
3
2
4
5
Bildungsformate
Projektübersicht
Festival of FOO
EDA-Tool
Visualisierungen
6
Ressourcen
1 Projektübersicht
1 Projektübersicht
Hintergrund
- Datenspenden zur Erforschung von algorithmischer Systeme
- e.g. Citizen Browser, Mozilla Rally, Open Schufa
- seit Juli 2021 Datenspendeplattform und Scraper (Dataskop)
- 1. Datenspende-Projekt „Was zeigt dir der YouTube-Algorithmus zur Bundestagswahl 2021?“
- aktuell schulische und außerschulische Lernszenarien
- ab 2022 für Forschungseinrichtungen, NGOs und Redaktionen offen
1 Projektübersicht
Verfahren
- Dataskop nutzt Screen-Scraping
- Browser ließt html-Text der YouTube-Seiten aus
- A) Demoversion oder B) Login und Scraping
- nach YouTube-Login Auslesen von pers. Verlauf
- Autoplayexperimente: News, Seedvideos, Suchbegriffe
- C) Speichern als json (lokal) und Visualisierungen
- D) kurze demografische Umfrage
- E) Datenspendeerklärung und Upload
1 Projektübersicht
1 Projektübersicht
Dataskop auf GitHub:
https://github.com/algorithmwatch
- dataskop-electron
- dataskop-platform
Erste Ergebnisse: YouTube zur Bundestagswahl 2021
- 6 Wochen über 5000 Datenspenden
- Auswertung durch Viadrina und der Spiegel
- In "News" kaum Unterschied zwischen Login/Logout
- Springers WELT-Kanal prominent in "Top-Stories"
- Suchanfragen bevorzugen aktuelle Videos
- Autoplay favorisiert Abos, Likes und Watchtime
- 10% Spender*innen bekommen sog. Borderline-Content
1 Projektübersicht
Erste Ergebnisse: YouTube zur Bundestagswahl 2021
YouTube will es möglichst allen Nutzer*innen recht machen.
1 Projektübersicht
2 Bildungsformate
Schulische Bildungsformate durch Universität Paderborn mit Fokus auf:
-
Prinzipien des kollaborativen Filterns
-
User-Item-Matrix und Matritzenrechnung
-
Profile und personalisierte Empfehlungen
2 Bildungsformate
Außerschulisches Bildungsformat durch mediale pfade
-
für 14- bis 21-Jährige
-
gamebased Learning als Türöffner für komplexe Inhalte
-
kollaboratives storybasiertes Gruppenspiel ca. 3 Stunden
-
durchführbar als Remote-Version oder in Präsenz
-
mit Desktoprechnern und Browser
-
„Festival of FOO" (AT)
2 Bildungsformate
Außerschulische Bildungsformat mit Themen-Fokus auf:
-
Daten als Ressource, Daten als Kapital
-
Algorithmen in kapitalistischen Verwertungsökonomien
-
Auswirkungen auf Inhaltsproduktion
-
Recommender - Black Box und Betriebsgeheimnis
-
Grundlagen gemeinwohl-orientierter Algorithmen
- Open Data, Transparenz und Civic Science
2 Bildungsformate
3 Festival of FOO
Musikplattform, Gig-Media, Trendmaschine
beyond the hype
FOO
discover your true music
3 Festival of FOO
let your star shine
life is live
live is life
Prolog: Das Foo-Festival
Teilnehmende/Player Characters (PC):
- erfahren vom Festival of FOO
- übernehmen Rolle eines Web-Studios
- entwickeln ihren Musikstar (Starpass)
- launchen ihr Profil (erstes ⭐-Rating)
- Wildcard Foo-Festival bei mind. x⭐
3 Festival of FOO
Kapitel 1 - Der erste Gig-On
Teilnehmende/Player Characters (PC):
- spielen ersten Online-Gig (ganz okay... +2 ⭐)
- beobachten Trendsetter (Band "E.G.O.")
- folgen Gerüchten (Doc Coda, CEOs etc.)
- rätseln über Algorithmus (Rating, Blackbox, Trendmaschine)
3 Festival of FOO
Kapitel 2 - DataSkop/DarkSkop
Teilnehmende/Player Characters (PC):
- bekommen DataSkop von Doc Coda (Gründer*in: Analyse-Account für FOO)
- bekommen DarkSkop von T4sty (dubiose Quelle: Einbruch in FOO-Account von "E.G.O.")
- kennen Dashboard, Experimente, Visualisierungen
3 Festival of FOO
Kapitel 3 - Tour de Foo
Teilnehmende/Player Characters (PC):
- suchen Fragestellungen zu Visualisierungen
- passen eigene Inhalte an Algorithmus an
- spielen Online Gigs, testen Anpassungen
- Star-Rating steigt um +x⭐
- FOO-Account von "E.G.O." steigt um +x²⭐
3 Festival of FOO
Kapitel 4 - The Nominees are...
Teilnehmende/Player Characters (PC):
- entdecken Betrug durch E.G.O./CEOs
- verschiedene Enden, ein Ziel:
- werden gesperrt (DataSkop/DarkSkop)
- verbünden sich zum FOO-Festival (Mainstream)
- veröffentlichen Schwindel (Whistleblowing)
- Ziel: Wie sieht ein "fairer" Algorithmus aus?
3 Festival of FOO
Kapitel 4 - Common Ground, Common Good
Teilnehmende/Player Characters (PC):
- sehen wie FOO abschmiert (Platform Escape)
- treffen Doc Coda, um neue Plattform zu entwickeln
- diskutieren Bedingungen für "faire" Plattform
- entwickeln Ideen zu gemeinwohl-orientiertem Algorithmus
3 Festival of FOO
Epilog - Auswertungen und Feedback
Teilnehmende/Player Characters (PC):
- werten die persönliche Spielerfahrung aus
- erfahren, dass DataSkop ein echtes Tool ist
- finden Gemeinsamkeiten/Unterschiede FOO vs. YouTube
- können ihren eigenen YT-Account untersuchen (Ü18)
- identifizieren Akteure, Datenerhebung, Recommender
- diskutieren das Projekt (Data Donation, Open Science)
3 Festival of FOO
4 EDA-Tool
4 EDA-Tool
Hintergrund Game-based Learning
-
EDA-Tool als Spielelement immersiver Methode
- Name z.B. DarkSkop, DataMirror
- keine Verweise auf Gesamtprojekt
- 2 Designs (grün/violett)
-
Visualisierungen synthetischer Daten
- Viz sind Lösungen zu Spielaufgaben
- Spielaufgaben sind durch Geschichte motiviert
Struktur EDA-Tool
-
Fake-Login zu 2 Versionen
- coda-Account (grün)
- E.G.O.-Account (violett)
- div. Seiten (Dashboard, Experimente, Logout)
- Logout führt zu Fake-Login und hidden Link zu Google-Login mit Gesamtfunktionalität
- keine Datenspende
4 EDA-Tool
Weitere Funktionen
-
Experimente anpassen
-
Eingabe ID Seed-Videos/Suchbegriff -> Scraping -> Viz
-
-
Synthetische Daten laden/konfigurieren
-
Konfiguration synthetischer Daten über Eingabemaske, Import Tabelle oder im Backend etc. -> json generieren/laden
-
z.B. Anpassung der Kategorienamen, Hashtags, Watchtime, percWatch, Videolänge, Titel
-
-
Neue Visualisierungs-Funktionen
4 EDA-Tool
5 Visualisierungen
5 Visualisierungen
zusätzliche Anforderungen:
frei wählbare Kategorien (synth. Data)
Aufgabe:
Nutzt “Dataskop” und analysiert, welche Musikstile/Kategorien auf FOO am erfolgreichsten sind, was trendet aktuell?
synthetische Daten:
category(genre), watchedAT, ∅percWatched, totalWatchtime, ∅watchTime, videoCount, favCategory, timePeriod (in days/weeks)
Visualisierung:
Welche Kategorien/Genres werden in der letzten Woche fast vollständig geschaut?
5 Visualisierungen
Aufgabe:
Findet das FOO-Trainingsvideo und startet ein Empfehlungsexperiment auf dem Account (E.G.O./Coda). Gibt es einen Auffälligkeiten bei den Videos, die euch vorgeschlagen werden?
synthetische Daten:
id, thumbnail, category, uploadDate, channelName, viewCount, hashtags
Visualisierung:
Was haben die erfolgreichsten Video (viewCount) gemeinsam, die zu einem ähnlichen Zeitpunkt (uploadDate) hochgeladen wurden?
zusätzliche Anforderungen:
frei wählbare Kategorien (synth. Data), weitere Filter (thumbnail, channelName, viewCount, hashtags)
5 Visualisierungen
Aufgabe:
Welche Länge sollte euer nächster Video-Upload idealerweise haben?
synthetische Daten:
id, category, duration, percWatched, watchedAt
Visualisierung:
Beim ausgewählten Betrachten der erfolgreichsten Kategorie/Genre lässt sich die durchschnittliche Videolänge und der durchschnittliche Watchtime-Wert in Prozent aller Videos dieser Kategorie ermitteln.
zusätzliche Anforderungen:
frei wählbare Kategorien (synth. Data), weitere Filter (chooseCategory ), Anzeige der Daten: watchTime, Videos, ∅percWatched, ∅duration per Category
5 Visualisierungen
Aufgabe:
Durch die Analyse lässt sich eine Tendenz ableiten. Finde heraus, welches Musikgenre wahrscheinlich in Zukunft, also zum Festival of FOO trenden wird. Nutze hierfür das Dashboard.
synthetische Daten:
category(genre), watchedAT, percWatched, categoryFavorite
Visualisierung:
Welche Kategorie hat über einen Zeitraum den meisten Zuwachs an Watchtime
zusätzliche Anforderungen:
Auswahl der Darstellungsweise (Graph, Bubbles etc.)
Auswahl der angezeigten Daten
5 Visualisierungen
Aufgabe:
Durch die Analyse lässt sich eine Tendenz ableiten. Finde heraus, welches Musikgenre wahrscheinlich in Zukunft, also zum Festival of FOO trenden wird. Nutze hierfür das Dashboard.
synthetische Daten:
ID, Category, Channel, Logged-in/-out, Thubnails
Visualisierung:
Über welchen Suchbegriff erscheinen welche Videos in der Vorschlagsliste
zusätzliche Funktionen:
Eingabemöglichkeit Suchbegriff
Auswahl der dargestellten Daten (Thumbnail, Channel, Category)
6 Ressourcen
6 Ressourcen
Hintergrund Game-based Learning
-
EDA-Tool als Spielelement immersiver Methode
- Name z.B. DarkSkop, DataMirror
- keine Verweise auf Gesamtprojekt
- 2 Designs (grün/violett)
-
Visualisierungen synthetischer Daten
- Viz sind Lösungen zu Spielaufgaben
- Spielaufgaben sind durch Geschichte motiviert
6 Ressourcen
Ultralativ zu algorithmischer Transparenz und dem Projekt DataSkop
6 Ressourcen
Links:
- DataSkop-Auswertung: https://dataskop.net/erste-ergebnisse/
- Spiegel-Auswertung https://www.spiegel.de/netzwelt/youtube-vor-der-wahl-wie-es-der-algorithmus-allen-recht-machen-soll-a-e364dccf-5f72-4736-ae1c-bdf0d213dcf1
- Data Trusts https://digitalautonomy.net/policy-brief-data-trusts
Zeit für Diskussion und Fragen...
6 Ressourcen
Außerschulische Lernziele 1
Die Teilnehmenden:
- kennen gesellschaftliche und wirtschaftliche Akteure, ihre Zwecke und Ambivalenzen, beim Einsatz algorithmischer Empfehlungssysteme
- kennen die Bedeutung von Daten als Kapital für private und gemeinwohlorientierte Zwecke,
- wissen, welche gesellschaftlich-kulturellen Auswirkungen Empfehlungsalgorithmen auf Inhaltsproduktion haben,
2 Visualisierungen
Außerschulische Lernziele 2
Die Teilnehmenden:
- haben Handlungsoptionen kennengelernt, die ihnen erlauben, mit Algorithmen kreativ und emanzipatorisch umzugehen
- können einschätzen, ob ein algorithmisches Empfehlungssystem im Einsatz ist,
- haben ein Verständnis der Begriffe Algorithmus, Recommender, (Meta)-Daten, Profil, Open Data, Big Data, Civic Science entwickelt.
2 Bildungsformate
Robert Behrendt
@textungen @medialepfade medialepfade.org
Dataskop Außerschulisches Lernszenario
By mediale pfade
Dataskop Außerschulisches Lernszenario
Beispiel, Anforderungen, Pädagogik
- 302