מחשביםסוגי קבצים

בפורמט CSV, או איפה לשים את הפסיק?

בין היישומים, מתמודד אם לא מתכנת, הוא כבר משתמש מתקדם, לייבא נתונים מיישום אחד למשנהו ואינה מתרחשת לעתים רחוקות מאוד. ולעתים קרובות למדי יש צורך לייבא נתונים טבלאיים, אשר, למעשה, נטבע על ידי בפורמט CSV. מי שפותח כמה פתרונות חלופיים (מנהיג XML ביניהם). אבל יצירת קובץ CSV, ובמקרים מסוימים, היא הפתרון הנוח ביותר, וחלקם - הבעייתי ביותר.

זה מייצג את השם של הפורמט כמו commaseparatedvalues - ערכים מופרדים בפסיקים. בשנת קובץ Notepad כדלקמן:

00, 01, 02, 03;

01, 15, 34, 11;

16, 27, 33, 06 (בסוף הסימן לשים לא חובה)

וגם יישום גיליון אלקטרוני של Excel או דומה כבר אז:

00 01 02 03
01 15 34 11
16 27 33 06

אבל עכשיו אנחנו דנו במקרה הפשוט. הבעיות מתחילות רק בגלל העובדה כי בשל דיווח נתונים דחוס מאוד, בפורמט CSV משמש להעברת כמויות גדולות של מידע. לרוב נמצא מסדי נתונים של ערכים מגוונים: מספריים, אלפא, אלפא נומרי, עם מרחבים, וכו ' לעתים קרובות במערכים גדולים הם טעויות, ואם, למשל, אי שם יהיה פסיק מיותר בתכנים של אחד מהשדות, כל התאים ניתן שנעקר על ידי אחד.

ככלל, בעיות מתעוררות כאשר נתונים מיובאים באמצעות פורמט הקובץ CSV, ניתן לחלק לשלוש קטגוריות:

1 - שדות מילוי שגויים.

2 - המרת נתונים שגויה בעת שמירת קובץ CSV.

3 - הכרה שגויה יבואן פורמט תכנית.

המקרה הראשון בחנו באופן חלקי. כדי להילחם בתופעה, אתה חייב לספק אמצעי ניטור התקינות של הנתונים שהוזנו. לדוגמה, אם אתה צריך לאסוף מסד נתונים של כתובות עבור לרשימת התפוצה, יש סקריפטים מיוחדים לבדוק אם אדם נכנס דואר אלקטרוני בפורמט הנכון. איפה ישנם פערים, פסיקים, וכן כל נתון אחר שיכול להיקרא טועה, את התוכן של השדה חייב להיות מוקף במרכאות (מה שנקרא מחשב "").

המקרה השני קשור אפשרויות הקידוד. צריך לברר קרובות נחווה על ידי מה הקידוד מעדיפים לייבא התוכנית. ב- Windows נפוץ 1251, כך שאם את הקובץ המקורי יפגוש את טקסט Unicode, פעל הוא יוצג ביישום יעד כשרשרת של שאלות. ב- Excel, אתה יכול לשמור בפורמט CSV עם קידוד מפריד שונים (למעט הנקודה עדיין בלשונית השימוש, ו-פסיק), אבל עדיף ליצור קובץ ב Notepad ++ או OpenOfficeCalc.

המקרה השלישי - תוצאה של השני. מבחינה היסטורית, בפורמט CSV אין קנה מידה אחיד. תוכניות רבות נתפסות CSV ו קובץ TSV (מופרד באמצעות טאבים) ו SCSV (מופרד באמצעות נקודה-פסיק), בפרט משום סיומת הקובץ אינה מדווחת על זה. במקרה זה, הנתונים לקרוא שגוי ואינם מיוחסים בין תאים בסדר הנכון. הדבר הטוב ביותר שאנחנו יכולים לייעץ - כדי ליצור קובץ CSV באופן אישי. כפי שכבר הוזכר, הוא צריך לנצל את העורך נוח.

טריקים כיצד לאלף את פורמט CSV, מתכנתים ידועים. משתמשים פשוט צריכים לדבוק בהמלצות שלנו בנוגע ליצירת קובץ. ובטח לא את הבעיות מתרחשים כאשר הקובץ נוצר במיוחד עבור היבוא ליישום ספציפי (ולפעמים בצורה שונה). קל יותר לקחת בחשבון את כל הבעיות האפשריות שנתקלו בהם נתונים.

Similar articles

 

 

 

 

Trending Now

 

 

 

 

Newest

Copyright © 2018 iw.atomiyme.com. Theme powered by WordPress.