Hi
Bitte keine Push-Posts.
Du erkennst das Problem schon: YT hat so viel spezielle Sachen,
dass ein universell funktionierender Zugriff auf Videodaten ziemlich komplex wird.
Hab mal ganze 2 Wochen daran "geforscht" (seitdem Projekt auf Eis).
Fazit: Möglich ja, legal sogar irgendwie auch (denk ich zumindest),
aber bevor ich ein Downloadprogramm oder sowas überhaupt anfangen kann,
dass alle möglichen Videos behandeln können soll, brauch ich noch mal zwei Wochen.
Nur um ein paar Beispiele zu nennen:
*Verschiedene mögliche Video-only-Streams, manchmal mit Ton, manchmal ohne
Verschiedene Container, verschiedene Codecs,
manchmal Identische doppelt mit anderer "Aufschrift",
manchmal angebliche Videostreams in denen kein Video drin ist (automatisch erkennen? ...)
Manchmal (oft) nicht-codeckonforme Daten (vor allem bei FLV), die erst repariert werden müssen
*Dazu separate Tonstreams, eventuell Dekodierung nötig.
Was mit welchem Video zusammenpasst erfährt man
aus einer Kombination von XML und undokumentierten "Magic Numbers"
(ca. 50 Format-IDs...was was ist muss man ausprobieren)
*Untertitel (Text) in verschiedenen Sprachen (als separater Datenhaufen)
*Untertitelaudiostreams (generierter Ton)
*Bildschirmtext (das Zeug, was in so Kästchen auftaucht) in eigenem Dateiformat
*Alles bisher genannte muss eventuell zeitlich verschoben/verschnellert/verlangsamt
betrachtet werden, laut XML-Zeug.
*Regelmäßig passende Ajax-Reaktionen auf die Daten des CDN, um nicht ignoriert zu werden
*Das CDN würgt die durchgehende Verbindung gern mal ab (wenn zu viel Last etc.)
Dann muss man den Rest vom Video nochmal anfordern
(wieviel ms hab ich schon? Codec verstehen...)
und die zwei/mehr Dateien codeckonform zusammenführen
(wirklich "lustig" örks. Zum Glück ist ffmpeg auch als Lib verfügbar)
Es kommt nur zu ca. 70% vor, dass man das ganze Video an einem Stück bekommt
*"Fallenseiten", die sich schwer von echten Videos unterscheiden lassen
Wenn man versucht, das angebliche Video abzuspielen
kann man seine IP für die nächsten paar Tage vergessen.
*Wenn man viel macht bekommt man ab und zu mal Captchas,
gebunden auf die IP -> Router vom Programm aus steuern, auch sehr lustig
(falls man das nötig hat. Wenn nur wenig Aktivität normalerweie nicht)
*Die ganzen Metadaten (Uploader usw.) gehen in Richtung "Tausende Zeilen"
*Immer SicherheitsIDs bei den Aufrufen nötig. Was da drin ist
muss man selbst mühsam rausfinden, und der Hashalgorithmus
ist auch eine Eigenentwicklung von YT
---
Das soll keine Entmutigung sein...oder eigentlich doch.
Nicht, dass ich ich dich davon abhalten will, aber kannst du das,
was du machen willst, nicht ohne YT erreichen?
Wenn du willst (und ich mal genug Zeit finde) könnte ich vllt. die mir bekannten Sachen
etwas aufbereiten (bzw. schön gesammelt und verständlich aufschreiben)
und dir schicken. Ich sag aber gleich, dass es ohne der fehlenden Hälfte sinnlos ist.