Visualizzazione dei risultati da 1 a 2 su 2
  1. #1

    [C] indicizzare pagina html

    Devo realizzare un programma che data una pagina html mi fornisca le "parole chiave" (tutte le parole esclusi articoli, congiunzioni):

    1 come posso far "leggere" la pagina?

    2 ho trovato trovato questo codice sul sito, come mi può essere utile?



    #include <stdio.h>
    #include <winsock.h>

    int main()
    {
    struct sockaddr_in sock; //la struttura per il socket
    struct hostent *ip; //la struttura per l'indirizzo
    char msg_enter[] = "GET /directory/file.html HTTP/1.0\n\n"; // RICHIESTA FILE
    char msg_response[] = "\0"; la risposta
    int s;

    WORD wVersionRequested; //la versione
    WSADATA wsaData; //????
    wVersionRequested = MAKEWORD(2, 2); //attiva la lib winsock 2.2
    WSAStartup(wVersionRequested, &wsaData); //la starta
    s = socket(AF_INET, SOCK_STREAM, 0); //crea il socket
    ip = gethostbyname("www.pincopallino.net"); // INDIRIZZO
    sock.sin_family = AF_INET; // tipo di indirizzo ...... di solito sempre AF_INET
    sock.sin_port = htons(80); // PORTA
    memcpy(&sock.sin_addr, ip->h_addr, ip->h_length); //copia l'indirizzo nella struttura socket
    connect(s, (struct sockaddr *)&sock, sizeof(sock)); //associa al socket s la struttura socket
    printf("Inviato al server:\n\n%s\n", msg_enter);
    send(s, msg_enter, strlen(msg_enter) + 1, 0); //invia dati
    printf("Ricevuto dal server:\n\n");
    while(recv(s, msg_response, 1, 0) != 0)
    {
    printf("%c", msg_response[0]);
    Sleep(10);
    }

    // chiude il socket
    shutdown(s, 2);
    closesocket(s);
    WSACleanup();
    system("pause");
    return 0;
    }

  2. #2
    Nessuno che mi aiuta?



    Forse la mia domanda non era chiara:

    come posso da una pagina html estrarre parole chiave che saranno successivamente messe in un database?

    Speriamo che la notte ci porti consiglio

Permessi di invio

  • Non puoi inserire discussioni
  • Non puoi inserire repliche
  • Non puoi inserire allegati
  • Non puoi modificare i tuoi messaggi
  •  
Powered by vBulletin® Version 4.2.1
Copyright © 2024 vBulletin Solutions, Inc. All rights reserved.