
Основният проблем при четенето на csv файлове от уеб сървър е, че разделителят, използван във файла, може да не е същият като разделителя, използван от Python. Това може да доведе до грешки при опит за импортиране на данните в Python.
import csv import urllib2 response = urllib2.urlopen('http://samplecsvs.s3.amazonaws.com/SalesJan2009.csv') csv_file = csv.reader(response) for row in csv_file: print row
Този код импортира модулите csv и urllib2. След това използва urllib2, за да отвори URL адреса „http://samplecsvs.s3.amazonaws.com/SalesJan2009.csv“. След това кодът създава променлива csv_file, която е зададена на функцията csv.reader, като предава променливата за отговор като аргумент. След това кодът използва for цикъл, за да премине през всеки ред в csv_file и отпечатва всеки ред на конзолата.
CSV файлове
CSV файловете са файлове със стойности, разделени със запетая. Те обикновено се използват за съхраняване на данни в табличен формат. CSV файловете могат да се четат от csv модула на Python.
Уеб и CSV съвети
Има няколко съвета за работа с уеб и CSV данни в Python.
Първо, важно е да разберете, че има два различни типа данни: текстови и двоични. Двоичните данни са съставени от 1s и 0s, докато текстовите данни са просто поредица от знаци.
Когато работите с двоични данни, е важно да използвате правилните инструменти. Например библиотеката pandas може да се използва за четене и запис на двоични файлове.
Второ, важно е да следите имената на колоните, когато работите с CSV файлове. Python има вградена функция, наречена split(), която може да се използва за разделяне на файл на отделни колони.
И накрая, също така е важно да запомните, че CSV файловете са стойности, разделени със запетая (CSV). Това означава, че всяка колона трябва да бъде посочена на отделен ред.