DataSkop

Was passiert mit meinen Daten?

@textungen @medialepfade medialepfade.org

 

 

 

Robert Behrendt

Überblick

Überblick

Für inklusive Pädagogik und Potentialentfaltung, 

 

1

3

2

4

5

Bildungsformate

Projektübersicht

Festival of FOO

EDA-Tool

Visualisierungen

6

Ressourcen

1 Projektübersicht

1 Projektübersicht

Hintergrund

  • Datenspenden zur Erforschung von algorithmischer Systeme
    • e.g. Citizen Browser, Mozilla Rally, Open Schufa
  • seit Juli 2021 Datenspendeplattform und Scraper (Dataskop)
  • 1. Datenspende-Projekt „Was zeigt dir der YouTube-Algorithmus zur Bundestagswahl 2021?“
  • aktuell schulische und außerschulische Lernszenarien
  • ab 2022 für Forschungseinrichtungen, NGOs und Redaktionen offen

1 Projektübersicht

Verfahren

  • Dataskop nutzt Screen-Scraping
    • Browser ließt html-Text der YouTube-Seiten aus
    • A) Demoversion oder B) Login und Scraping
      • nach YouTube-Login Auslesen von pers. Verlauf
      • Autoplayexperimente: News, Seedvideos, Suchbegriffe
    • C) Speichern als json (lokal) und Visualisierungen
    • D) kurze demografische Umfrage
    • E) Datenspendeerklärung und Upload

1 Projektübersicht

1 Projektübersicht

Dataskop auf GitHub:

https://github.com/algorithmwatch

  • dataskop-electron
  • dataskop-platform

 

Erste Ergebnisse: YouTube zur Bundestagswahl 2021

  • 6 Wochen über 5000 Datenspenden
  • Auswertung durch Viadrina und der Spiegel
  • In "News" kaum Unterschied zwischen Login/Logout
  • Springers WELT-Kanal prominent in "Top-Stories"
  • Suchanfragen bevorzugen aktuelle Videos
  • Autoplay favorisiert Abos, Likes und Watchtime
  • 10% Spender*innen bekommen sog. Borderline-Content

1 Projektübersicht

Erste Ergebnisse: YouTube zur Bundestagswahl 2021

YouTube will es möglichst allen Nutzer*innen recht machen.

1 Projektübersicht

2 Bildungsformate

Schulische Bildungsformate durch Universität Paderborn mit Fokus auf:

  • Prinzipien des kollaborativen Filterns

  • User-Item-Matrix und Matritzenrechnung

  • Profile und personalisierte Empfehlungen

2 Bildungsformate

Außerschulisches Bildungsformat durch mediale pfade

  • für 14- bis 21-Jährige

  • gamebased Learning als Türöffner für komplexe Inhalte

  • kollaboratives storybasiertes Gruppenspiel ca. 3 Stunden

  • durchführbar als Remote-Version oder in Präsenz

  • mit Desktoprechnern und Browser

  • „Festival of FOO" (AT)

2 Bildungsformate

Außerschulische Bildungsformat mit Themen-Fokus auf:

  • Daten als Ressource, Daten als Kapital

  • Algorithmen in kapitalistischen Verwertungsökonomien

  • Auswirkungen auf Inhaltsproduktion

  • Recommender - Black Box und Betriebsgeheimnis

  • Grundlagen gemeinwohl-orientierter Algorithmen

  • Open Data, Transparenz und Civic Science

2 Bildungsformate

3 Festival of FOO

Musikplattform, Gig-Media, Trendmaschine

beyond the hype

FOO

discover your true music

3 Festival of FOO

let your star shine

 life is live 

 live is life 

Prolog: Das Foo-Festival

Teilnehmende/Player Characters (PC):

  • erfahren vom Festival of FOO
  • übernehmen Rolle eines Web-Studios
  • entwickeln ihren Musikstar (Starpass)
  • launchen ihr Profil (erstes -Rating)
  • Wildcard Foo-Festival bei mind. x

3 Festival of FOO

Kapitel 1 - Der erste Gig-On

Teilnehmende/Player Characters (PC):

  • spielen ersten Online-Gig (ganz okay... +2)
  • beobachten Trendsetter (Band "E.G.O.")
  • folgen Gerüchten (Doc Coda, CEOs etc.)
  • rätseln über Algorithmus (Rating, Blackbox, Trendmaschine)

3 Festival of FOO

Kapitel 2 - DataSkop/DarkSkop

Teilnehmende/Player Characters (PC):

  • bekommen DataSkop von Doc Coda (Gründer*in: Analyse-Account für FOO)
  • bekommen DarkSkop von T4sty (dubiose Quelle: Einbruch in FOO-Account von "E.G.O.")
  • kennen Dashboard, Experimente, Visualisierungen

3 Festival of FOO

Kapitel 3 - Tour de Foo

Teilnehmende/Player Characters (PC):

  • suchen Fragestellungen zu Visualisierungen
  • passen eigene Inhalte an Algorithmus an
  • spielen Online Gigs, testen Anpassungen
  • Star-Rating steigt um +x
  • FOO-Account von "E.G.O." steigt um +x²⭐

3 Festival of FOO

Kapitel 4 - The Nominees are...

Teilnehmende/Player Characters (PC):

  • entdecken Betrug durch E.G.O./CEOs
  • verschiedene Enden, ein Ziel:
    • werden gesperrt (DataSkop/DarkSkop)
    • verbünden sich zum FOO-Festival (Mainstream)
    • veröffentlichen Schwindel (Whistleblowing)
  • Ziel: Wie sieht ein "fairer" Algorithmus aus?

3 Festival of FOO

Kapitel 4 - Common Ground, Common Good

Teilnehmende/Player Characters (PC):

  • sehen wie FOO abschmiert (Platform Escape)
  • treffen Doc Coda, um neue Plattform zu entwickeln
  • diskutieren Bedingungen für "faire" Plattform
  • entwickeln Ideen zu gemeinwohl-orientiertem Algorithmus

3 Festival of FOO

Epilog - Auswertungen und Feedback

Teilnehmende/Player Characters (PC):

  • werten die persönliche Spielerfahrung aus
  • erfahren, dass DataSkop ein echtes Tool ist
  • finden Gemeinsamkeiten/Unterschiede FOO vs. YouTube
  • können ihren eigenen YT-Account untersuchen (Ü18)
  • identifizieren Akteure, Datenerhebung, Recommender
  • diskutieren das Projekt (Data Donation, Open Science)

3 Festival of FOO

4 EDA-Tool

4 EDA-Tool

Hintergrund Game-based Learning

  • EDA-Tool als Spielelement immersiver Methode
    • Name z.B. DarkSkop, DataMirror
    • keine Verweise auf Gesamtprojekt
    • 2 Designs (grün/violett)
  • Visualisierungen synthetischer Daten
    • Viz sind Lösungen zu Spielaufgaben
    • Spielaufgaben sind durch Geschichte motiviert

Struktur EDA-Tool

  • Fake-Login zu 2 Versionen
    • coda-Account (grün)
    • E.G.O.-Account (violett)
  • div. Seiten (Dashboard, Experimente, Logout)
  • Logout führt zu Fake-Login und hidden Link zu Google-Login mit Gesamtfunktionalität
  • keine Datenspende

4 EDA-Tool

Weitere Funktionen

  • Experimente anpassen

    • Eingabe ID Seed-Videos/Suchbegriff -> Scraping -> Viz

  • Synthetische Daten laden/konfigurieren

    • Konfiguration synthetischer Daten über Eingabemaske, Import Tabelle oder im Backend etc. -> json generieren/laden

    • z.B. Anpassung der Kategorienamen, Hashtags, Watchtime, percWatch, Videolänge, Titel

  • Neue Visualisierungs-Funktionen

4 EDA-Tool

5 Visualisierungen

5 Visualisierungen

zusätzliche Anforderungen:

frei wählbare Kategorien (synth. Data)

Aufgabe:

Nutzt “Dataskop” und analysiert, welche Musikstile/Kategorien auf FOO am erfolgreichsten sind, was trendet aktuell?

synthetische Daten:

category(genre), watchedAT, ∅percWatched, totalWatchtime, ∅watchTime, videoCount, favCategory, timePeriod (in days/weeks)

Visualisierung:

Welche Kategorien/Genres werden in der letzten Woche fast vollständig geschaut?

5 Visualisierungen

Aufgabe:

Findet das FOO-Trainingsvideo und startet ein Empfehlungsexperiment auf dem Account (E.G.O./Coda). Gibt es einen Auffälligkeiten bei den Videos, die euch vorgeschlagen werden?

synthetische Daten:

id, thumbnail, category, uploadDate, channelName, viewCount, hashtags

Visualisierung:

Was haben die erfolgreichsten Video (viewCount) gemeinsam, die zu einem ähnlichen Zeitpunkt (uploadDate) hochgeladen wurden?

zusätzliche Anforderungen:

frei wählbare Kategorien (synth. Data), weitere Filter (thumbnail, channelName, viewCount, hashtags)

5 Visualisierungen

Aufgabe:

Welche Länge sollte euer nächster Video-Upload idealerweise haben?

synthetische Daten:

id, category, duration, percWatched, watchedAt

Visualisierung:

Beim ausgewählten Betrachten der erfolgreichsten Kategorie/Genre lässt sich die durchschnittliche Videolänge und der durchschnittliche Watchtime-Wert in Prozent aller Videos dieser Kategorie ermitteln.

zusätzliche Anforderungen:

frei wählbare Kategorien (synth. Data), weitere Filter (chooseCategory ), Anzeige der Daten: watchTime, Videos, ∅percWatched, ∅duration per Category

5 Visualisierungen

Aufgabe:

Durch die Analyse lässt sich eine Tendenz ableiten. Finde heraus, welches Musikgenre wahrscheinlich in Zukunft, also zum Festival of FOO trenden wird. Nutze hierfür das Dashboard.

synthetische Daten:

category(genre), watchedAT, percWatched, categoryFavorite

Visualisierung:

Welche Kategorie hat über einen Zeitraum den meisten Zuwachs an Watchtime

zusätzliche Anforderungen:

Auswahl der Darstellungsweise (Graph, Bubbles etc.)

Auswahl der angezeigten Daten

5 Visualisierungen

Aufgabe:

Durch die Analyse lässt sich eine Tendenz ableiten. Finde heraus, welches Musikgenre wahrscheinlich in Zukunft, also zum Festival of FOO trenden wird. Nutze hierfür das Dashboard.

synthetische Daten:

ID, Category, Channel, Logged-in/-out, Thubnails

Visualisierung:

Über welchen Suchbegriff erscheinen welche Videos in der Vorschlagsliste

zusätzliche Funktionen:

Eingabemöglichkeit Suchbegriff

Auswahl der dargestellten Daten (Thumbnail, Channel, Category)

6 Ressourcen

6 Ressourcen

Hintergrund Game-based Learning

  • EDA-Tool als Spielelement immersiver Methode
    • Name z.B. DarkSkop, DataMirror
    • keine Verweise auf Gesamtprojekt
    • 2 Designs (grün/violett)
  • Visualisierungen synthetischer Daten
    • Viz sind Lösungen zu Spielaufgaben
    • Spielaufgaben sind durch Geschichte motiviert

6 Ressourcen

Ultralativ zu algorithmischer Transparenz und dem Projekt DataSkop

6 Ressourcen

Links:

  • DataSkop-Auswertung: https://dataskop.net/erste-ergebnisse/
  • Spiegel-Auswertung https://www.spiegel.de/netzwelt/youtube-vor-der-wahl-wie-es-der-algorithmus-allen-recht-machen-soll-a-e364dccf-5f72-4736-ae1c-bdf0d213dcf1
  • Data Trusts https://digitalautonomy.net/policy-brief-data-trusts

Zeit für Diskussion und Fragen...

6 Ressourcen

Außerschulische Lernziele 1

Die Teilnehmenden:

  • kennen gesellschaftliche und wirtschaftliche Akteure, ihre Zwecke und Ambivalenzen, beim Einsatz algorithmischer Empfehlungssysteme
  • kennen die Bedeutung von Daten als Kapital für private und gemeinwohlorientierte Zwecke,
  • wissen, welche gesellschaftlich-kulturellen Auswirkungen Empfehlungsalgorithmen auf Inhaltsproduktion haben,

2 Visualisierungen

Außerschulische Lernziele 2

Die Teilnehmenden:

  • haben Handlungsoptionen kennengelernt, die ihnen erlauben, mit Algorithmen kreativ und emanzipatorisch umzugehen
  • können einschätzen, ob ein algorithmisches Empfehlungssystem im Einsatz ist,
  • haben ein Verständnis der Begriffe Algorithmus, Recommender, (Meta)-Daten, Profil, Open Data, Big Data, Civic Science entwickelt.

2 Bildungsformate

Robert Behrendt

@textungen @medialepfade medialepfade.org

 

 

 

Dataskop Außerschulisches Lernszenario

By mediale pfade

Dataskop Außerschulisches Lernszenario

Beispiel, Anforderungen, Pädagogik

  • 50
Loading comments...

More from mediale pfade