Pod względem technicznym wymagania sieciowe opisane wcześniej tak naprawdę sprowadzają się do dwóch czynników: musimy być w stanie prawidłowo przekazywać dane z odpowiednio dużą szybkością (wymaganie dotyczące przepływności) oraz, w przypadku wielu aplikacji, czas potrzebny przejście od źródła do miejsca docelowego (opóźnienie) musi być poniżej pewnego limitu. Oba te parametry muszą być naprawdę „end-to-end” między systemem świadczącym usługę a okiem, uchem lub ustami klienta. Należy wziąć pod uwagę każdy czas potrzebny, na przykład na kodowanie i dekodowanie obrazów wideo, a wszelkie narzuty na dane w postaci kodów korekcji błędów (używanych w zaszumionych kanałach transmisji) muszą być odjęte od surowej szybkości transmisji danych .Najbardziej wymagające wymagania dotyczące multimediów to te, które są potrzebne do przesyłania dźwięku i obrazu w czasie rzeczywistym w obu kierunkach. Odpowiednią jakość mowy można uzyskać przy kilkudziesięciu kbit/s. Przepustowość dla wideo jest wyższa: dziesiątki Mbit/s są wymagane dla telewizji wysokiej jakości, chociaż techniki kompresji wideo mogą zapewnić jakość porównywalną z dekodowanymi transmisjami satelitarnymi przy 2 Mbit/s. Jest to również około najniższej dopuszczalnej szybkości dla wideokonferencji (a potrzebujemy tych 2 Mbit/s do przesyłania obrazów z każdego studia konferencyjnego). Obrazy wideo o mniejszych rozmiarach (na przykład okno na ekranie komputera osobistego), które są nieco szarpane, mają gorszą rozdzielczość i które mają tendencję do rozpadania się w przypadku zbyt dużego ruchu, mogą być dostarczane z prędkością zaledwie 64 kbit/s. Ciągi zdjęć, odświeżanych w czasie krótszym niż sekundę, można w pewnych okolicznościach przesłać przez modem domowy przez Internet. Ze względu na potrzebę oszczędzania pasma, wszystkie praktyczne metody kodowania wideo, a niektóre dla mowy, wprowadzają opóźnienie między przechwyceniem obrazu przez kamerę telewizyjną a generowaniem strumienia bitów. Potrzebny jest kolejny czas na przejście przez sieć i wreszcie kolejne opóźnienie między odbiorem danych a ich konwersją na obraz na ekranie . Część tego opóźnienia wynika po prostu z czasu potrzebnego do działania algorytmu kodowania, ale część wynika również z faktu, że algorytm polega na pobieraniu różnicy między kolejnymi klatkami obrazu i przesyłaniu tylko sygnału reprezentującego różnicę między klatkami. To ostatnie opóźnienie jest oczywiście nieodłączne od systemu. Opóźnienie kodowania i dekodowania często nie stanowi problemu w przypadku odbioru jednokierunkowego (na przykład podczas oglądania filmu telewizyjnego), pod warunkiem oczywiście, że dźwięk jest opóźniony w synchronizmie, chociaż opóźnienie tego rodzaju może być dosłownie śmiertelne, jeśli na przykład przeprowadzano operację na odległość. Większy problem pojawia się podczas prowadzenia konferencji dwukierunkowych (lub wielostronnych): wprowadzenie opóźnienia przekraczającego kilka milisekund powoduje sztuczną, wymuszoną interakcję. Ogólnie rzecz biorąc, najbardziej rygorystycznym wymogiem dla rozrywki multimedialnej jest potrzeba wystarczającej przepływności, aby poradzić sobie z wysokiej jakości obrazem i dźwiękiem. Opóźnienie nie stanowi problemu, ponieważ nie ma potrzeby pobierania treści dokładnie wtedy, gdy to nastąpi. W przypadku konferencji interaktywnych wymóg jest dokładnie odwrotny: dopuszczalna jest ograniczona przepustowość, ale nie jest to duże opóźnienie. Inną różnicą między usługami rozrywkowymi a aplikacjami dwukierunkowymi peer-to-peer są względne koszty koderów i dekoderów. Usługi rozrywkowe mogą sobie pozwolić na drogi sprzęt kodujący dla stosunkowo niewielu ośrodków kodowania, ale wymagają tanich dekoderów dla wielu odbiorników (np. telewizorów), które są kupowane na bardzo wrażliwym cenowo rynku. Jednak konferencja oczywiście wymaga symetrycznego kodowania i dekodowania. Te różne wymagania wyjaśniają, dlaczego dzisiejsze rozwiązania dla rozrywki i komunikacji interaktywnej mają tendencję do podążania różnymi ścieżkami, próbując dopasować swoje sygnały do bardzo ograniczonych możliwości dzisiejszych sieci.