PingPlotter e AT & T’s flaky DNS server

Uno dei miei strumenti preferiti per rintracciare i problemi di rete è uno strumento chiamato PingPlotter pubblicato da Nessoft. Ho scritto su PingPlotter diverse volte (l’ultima volta nel 2011, anche se ha avuto anche un ruolo da protagonista nell’risolvere i miei problemi con AT&T nel 2012). In realtà, questa utility mi ha aiutato così tante volte è ridicolo. Ecco il mio riassunto di PingPlotter dalla mia ultima carrellata dei miei strumenti preferiti:

Pingplotter di Nessoft tests verifica la connettività a uno o più host di destinazione sulla rete locale o su Internet e traccia i risultati. Ciò che PingPlotter sta effettivamente facendo è eseguire ripetutamente un traceroute per identificare tutti i router intermedi tra la macchina e gli obiettivi e testare ciascuno per quanto tempo ci vuole per rispondere. Lo strumento misura anche “packet jitter” (la variazione della velocità con cui vengono gestiti i pacchetti), VoIP Mean Opinion Score o MOS (una stima della qualità della voce percepita) e deviazione standard del tempo di transito dei pacchetti. Pingplotter è disponibile in freeware, Standard ($24.95) e Pro (Pro 199.95) versioni. Pingplotter gets ottiene un punteggio di 5 su 5.

Recentemente ho dovuto utilizzare nuovamente PingPlotter quando i dispositivi sulla mia rete che configurano le loro connessioni di rete tramite DHCP serviti dal mio AT & T U-verse NVG-510 ADSL+ gateway hanno iniziato a rallentare.

Nel registro di NVG-510 (che è un registro circolare troppo breve) ho visto più occorrenze di errori DNS; ad esempio, da prima di oggi:

2014-07-10T22:21:28-07:00 L3 dnsmasq: no responses from nameserver '99.99.99.53'
2014-07-10T22:21:28-07:00 L3 dnsmasq: nameserver '99.99.99.53' is now responding

Molto spesso, questi errori si verificano nei cluster e i cluster possono continuare per minuti alla volta, quindi non sorprende che i dispositivi sulla mia rete che utilizzano configurazioni DHCP mostrino scarsa connettività.

Ho teorizzato in precedenza che l’implementazione di NVG-510 dello spedizioniere DNS del gateway (che si basa sul codice dnsmasq open source) ha un timeout troppo breve sulle query fallite. Ma perché una query fallirebbe?

Ho avviato PingPlotter e ho scoperto che entrambi i server DNS sono definiti e immutabili nel server DHCP del gateway (ovvero server DNS primari e secondari a 99.99.99.53 e 99.99.99.153 rispettivamente che, secondo whatsmydns.net, non esistono) sono ancora, come ho osservato nel 2012, flakey. Il problema ora sembra essere che sono diventati ancora più flakier.

Ecco un esempio dell’output di PingPlotter di ieri per i server DNS predefiniti di AT & T:

Mark Gibbs

Il tempo tra i ping è di 10 secondi e i blocchi rossi più stretti indicano 1 pacchetto perso. Come puoi vedere, ci sono frequenti perdite di pacchetti per 20 o 30 secondi (i blocchi di lunghezza doppia e tripla) o più. Questi cluster di pacchetti persi sono, essi stessi in cluster regolari come si può vedere da questa traccia per circa tre giorni e mezzo:

Mark Gibbs

Perché le risposte del server dovrebbero ottenere regolarmente meglio una volta al giorno è praticamente un mistero per ora.

Curiosamente, quelli non sono gli unici server DNS A&T ha altri server DNS primari e secondari a 68.94.156.1 e 68.94.157.1 rispettivamente. Tracciare il loro comportamento (le due tracce in basso) e i server DNS di Google su 8.8.8.8 e 8.8.4.4 (le prime due tracce) insieme ai server DNS predefiniti (le due tracce centrali) mostra che i server DNS possono essere raggiunti in modo affidabile attraverso la rete AT & T:

Mark Gibbs