Visualizzazione dei risultati da 1 a 2 su 2

Discussione: [Python] Dumbo/Hadoop

  1. #1
    Utente di HTML.it
    Registrato dal
    Feb 2006
    Messaggi
    75

    [Python] Dumbo/Hadoop

    Salve, sto seguendo questo tutorial per scrivere un applicazione distribuita per mapReduce/hadoop.
    Tutorial Dumbo/hadoop


    Ho installato correttamente hadoop e dumbo (per scrivere programmi hadoop in python)

    Riesco a portare a termine tutti gli step del tutorial ma quando vado a vedere l'output generato viene qualcosa del genere

    codice:
    SEQ/org.apache.hadoop.typedbytes.TypedBytesWritable/org.apache.hadoop.typedbytes.TypedBytesWritable�������ޭǡ�q���%�O��������������172.16.1.10������������������172.16.1.12������������������172.16.1.30������
    invece se eseguo il programma localmente (senza hadoop) ottengo correttamente un file con l'elenco degli indirizzi IP con accanto il relativo numero di occorrenze.

    Ho pensato si trattasse di un problema di codifica, quindi ho aggiunto .encode('utf-8') al sorgente python ma ottengo sempre lo stesso risultato.

    Qualcuno puoi aiutarmi? Grazie in anticipo

  2. #2
    Utente di HTML.it
    Registrato dal
    Feb 2006
    Messaggi
    75
    Mi rispondo da solo. Non c'è nessun errore.

    Quella è la forma serializzata del risultato, per convertirla basta usare il comando (presente anche nel tutorial tra l'altro )

    codice:
    dumbo cat ipcounts/part* -hadoop /usr/local/hadoop | sort -k2,2nr | head -n 5

Permessi di invio

  • Non puoi inserire discussioni
  • Non puoi inserire repliche
  • Non puoi inserire allegati
  • Non puoi modificare i tuoi messaggi
  •  
Powered by vBulletin® Version 4.2.1
Copyright © 2025 vBulletin Solutions, Inc. All rights reserved.