Blog durchsuchen
Profil
퀘 스 너 틸 로 wohnt in Seoul und arbeitet über
geometrische Topologie.
Letzte Einträge
- Topologie von Flächen CCXXI2 Kommentare· 25.05.12
- 25000 Unterzeichner gesucht6 Kommentare· 23.05.12
- Wissenschafts-Fernsehen3 Kommentare· 21.05.12
- Selbstorganisierende Untergrundbahnen8 Kommentare· 20.05.12
- Topologie von Flächen CCXX0 Kommentare· 18.05.12
Kommentare
- Thilo · 25.05.12 · 15:22 Uhr Topologie von Flächen CCXXI
- stag sprey · 25.05.12 · 13:19 Uhr 25000 Unterzeichner gesucht
- miesepeter3 · 23.05.12 · 10:26 Uhr Selbstorganisierende Untergrundbahnen
- Rainer · 22.05.12 · 13:26 Uhr Wissenschafts-Fernsehen
- Thilo · 18.05.12 · 14:17 Uhr "Nature" vor Gericht
Blogroll
- ScienceBlogs.de
- ScienceBlogs.com
- Mathematics Websites
- Mathematics Journals
- arXiv
- Mathblogging.org
- Terence Tao: What's new
- Images des Mathematiques
- Geometry and the Imagination
- Low dimensional Topology
- n-category cafe
- secret blogging seminar
- God Plays Dice
- Combinatorics and more
- The accidental mathematician
- Annoying precision
- Gödels lost letter
- XOR's Hammer
- Frank Morgan
- 360
- Area 777
- Ian Agol's Research Blog
- Links to Low-dimensional Topology
- Mathematical Reviews
- Zentralblatt
- Thilo Kuessner
Kategorien
Archiv
- Mai 2012
- April 2012
- März 2012
- Februar 2012
- Januar 2012
- Dezember 2011
- November 2011
- Oktober 2011
- September 2011
- August 2011
- Juli 2011
- Juni 2011
- Mai 2011
- April 2011
- März 2011
- Februar 2011
- Januar 2011
- Dezember 2010
- November 2010
- Oktober 2010
- September 2010
- August 2010
- Juli 2010
- Juni 2010
- Mai 2010
- April 2010
- März 2010
- Februar 2010
- Januar 2010
- Dezember 2009
- November 2009
- Oktober 2009
- September 2009
- August 2009
- Juli 2009
- Juni 2009
- Mai 2009
- April 2009
- März 2009
- Februar 2009
- Januar 2009
- Dezember 2008
- November 2008
- Oktober 2008
- September 2008
- August 2008
- Juli 2008
- Juni 2008
- Mai 2008
- April 2008
- März 2008
- Februar 2008
« vorheriger Beitrag · nächster Beitrag »
23.05.11 · 13:26 Uhr
Mehr Fehler am Abend
Kategorie: Technik · Kommentare: 10
Zwischen 0 und 4 Uhr passieren Programmierern die meisten Fehler, zwischen 7 und 12 Uhr die wenigsten. Das zeigt eine statistische Analyse der Kerne von Linux und PostgreSQL.
Die Arbeit Do Time of Day and Developer Experience Affect Commit Bugginess? von Eyolfson-Tan-Lam ist dieses Wochenende auf der 8th Working Conference on Mining Software Repositories vorgestellt worden.
Modern software is often developed over many years with hundreds of thousands of commits. Commit metadata is a rich source of social characteristics, including the commit's time of day and the experience and commit frequency of its author. The "bugginess" of a commit is also a critical property of that commit. In this paper, we investigate the correlation between a commit's social characteristics and its "bugginess";
Das interessanteste Ergebnis ist der Zusammenhang zwischen Fehleranzahl und Tageszeit:

Hingegen zeigen die Daten keinen Zusammenhang zwischen Fehleranzahl und Erfahrung (erfahrenen Programmierern passieren genausoviele Fehler, wobei "Erfahrung" sich im Kontext dieser Untersuchung allerdings nur auf die Erfahrung mit dem jeweiligen Projekt bezieht, also wielange der Programmierer schon bei Linux bzw. PostgreSQL beteiligt ist) oder zwischen Fehleranzahl und Wochentag (entgegen anderslautenden Vermutungen passieren an Freitagen nicht mehr Fehler):


Zur Methodik:
We define a bug-introducing commit to be any commit for which there exists a later bug-fixing commit that purports to fix the bug.
[...]
Following [19], our methodology has three steps: 1) enumerating bug-fixing commits; 2) identifying the lines changed in each bug-fixing commit; and 3) finding the commits which were responsible for the previous (buggy) version of each of the changed lines.
Heißt: erfaßt werden (natürlich) nur Fehler, die später korrigiert wurden.
Executing the above algorithm gives us data about the bug-fixing and bug-introducing commits in each repository, as well as about the authors of these commits. We record the following data for each commit: author (as a name/email pair); adjusted local time (as described below); number of lines changed; and number of times the commit introduced a bug later corrected (which is derived data; we record it to simplify later database queries). We also record a relation connecting bug-introducing commits and bug-fixing commits. For each author, we record the name, email(s) and commit frequency classification (defined below). We define a bug's lifetime to be the time from the earliest commit which introduced the bug to the bug-fixing commit. We compute each author's commit frequency classification, based on the frequency of an author's commits to a particular project, and author experience at commit time for each patch, based on the elapsed time between that author's first commit to the project and the commit time.
via Francis the Mule via Marc Abrahams
Autor: Thilo· 10 Kommentare· Permalink· Trackback-URL
Kommentar schreiben
Top5
- Liebe Piraten, lasst uns endlich vernünftig miteinander reden!Astrodicticum Simplex· 14.05.2012
- Risikowahrnehmung: Wenn man vor den falschen Dingen Angst hatAstrodicticum Simplex· 20.05.2012
- Dr. h.c. im Sonderangebot für 39 Euro[sic]· 14.05.2012
- Pi auf dem Einrad!Astrodicticum Simplex· 20.05.2012
- Die Erde dreht sich nicht um die Sonne...Astrodicticum Simplex· 12.05.2012
Top5
- Liebe Piraten, lasst uns endlich vernünftig miteinander reden!Astrodicticum Simplex· 14.05.2012
- Klimaschmock des Monats Mai 2012Primaklima· 20.05.2012
- Die kalte Sonne von Vahrenholt/Lüning: Le Trend, c'est moi!Primaklima· 16.05.2012
- Risikowahrnehmung: Wenn man vor den falschen Dingen Angst hatAstrodicticum Simplex· 20.05.2012
- Der NRW Wahlkampf - eine Analyse mit Noten.Primaklima· 14.05.2012
ScienceBlogs.com
- Doubt and other products: The National Toxicology Program's Report on Carcinogens, bad for whose business?by Elizabeth Grossman As it pursues its anti-regulatory agenda the ...The Pump Handle· 22.05.2012 · 16:39 Uhr
- Weekend Recap: My Annular Eclipse Expedition!A little more persistence a little more effort and what ...Starts With A Bang· 22.05.2012 · 00:11 Uhr
- Water, waterThis image has been going around the intertubes recently I ...A Few Things Ill Considered· 21.05.2012 · 22:59 Uhr
- To be or not to be? The Prevention and Public Health Fundby Kim Krisberg We will pay for this by taking ...The Pump Handle· 21.05.2012 · 15:19 Uhr
- An important revelation regarding Heartland Gate (global warming denialism)Peter Gleick has been cleared of faking a key memo ...Greg Laden's Blog· 21.05.2012 · 12:52 Uhr

Kommentare (10)
Der Commit-Zeitpunkt ist nicht unbedingt der Zeitpunkt, an dem der Fehler passiert ist.
Meine Vermutung ist, dass hier auch unzureichend überprüfte Commits reinspielen, die man halt schnell noch vor dem Schlafengehen rauskriegen will.
Meine Erklärung als nichtprogrammierender Langschläfer: Daß Programmierern zwischen sieben und zwölf die wenigsten Fehler passieren, liegt sicher daran, daß die ganzen Nerds um diese Zeit noch schlafen.
@Roland: Genau so sehe ich das auch als Programmierer. :)
Im Grunde ist das nichts anderes als die alte Weisheit: Wer arbeitet, macht Fehler. Wer viel arbeitet, macht viele Fehler. Wer nicht arbeitet, macht keine Fehler.
Programmierer haben nur halt etwas ungewöhnliche Arbeitszeiten. Aber vielleicht leben wir Programmierer in Europa auch nur nach den amerikanischen Zeitzonen... ;-)
Es geht aber schon um die "Percentage of buggy commits", nicht um die "total number of commits". Erstere entspricht den Säulen, letztere den weißen Kreisen in der Grafik (und ist von 14-16 Uhr am höchsten).
Könnte irgend jemand mir Informatik-Laien bitte mal erklären, was ein "commit" überhaupt ist?
Ich bin auch nicht vom Fach, aber es handelt sich wohl um die Speicherung einer Eingabe.
Ja, daß es um prozentuale Fehler geht, war schon klar - sonst wäre die Statistik ja recht nutzlos.
Interessant wäre jetzt noch, zu wissen, ob die Unterschiede lediglich auf einen biologischen Rhythmus zurückgehen (was sicher den Hauptanteil ausmacht, zur steigenden Fehlerhäufigkeit in der zweiten Nachthälfte gab es ja schon öfter mal Untersuchungen) oder ob da auch andere Gründe eine Rolle spielen. Kommen die Nachtschichtfehler von Programmierern, die einfach nachts arbeiten (Schichtarbeit oder weil es ihnen Spaß macht) oder ging es da oft darum, daß eine Arbeit ganz dringend noch fertigwerden mußte und man halt bis tief in die Nacht hinein arbeitete?
War zusätzlicher Stress vorhanden? Gibt es eine Beziehung zwischen der Fehlerhäufigkeit und der Anzahl der Stunden, die bereits gearbeitet wurde (vielleicht zweite Hälfte der üblichen Arbeitszeit oder vielleicht Überstunden)?
Trotzdem natürlich interessant.
Der Versuch einer Kurzfassung: Quellcode wird in der Regel in einer "Versionsverwaltung" gespeichert. Man verändert die Quelldateien des Programms, testet und behebt Fehler und kommt dann nach Stunden oder Tagen zum Schluss, dass nun alles fertig ist. Dann übergibt man die Änderungen an die Versionsverwaltung (commit) Die Änderungen stehen dann allen anderen Projektteilnehmern zur Verfügung.
Die Langfassung gibt's hier http://de.wikipedia.org/wiki/Versionsverwaltung
Wie AndreasM schon gesagt hat, ist die Behauptung "... passieren Programmierern die meisten Fehler" eine unzulässige Erweiterung der Aussagen der Studie. Es ging um Commits; diese finden notwendigerweise _nach_ dem Einbau des Fehlers statt. Man könnte jetzt genauso behaupten: Um 7 Uhr, nachdem die Programmierer die Nacht durchgearbeitet haben, committen sie die wenigsten Bugs.
Klar. Die meisten Fehler passieren während der normalen Arbeitszeiten. Da hätte ich jetzt auch nix anderes erwartet. :)