מרכז הדרכה - יוניקוד

הגעת לעמוד ארכיון - מערכת ניהול.

המידע לא בהכרח מדוייק או מסונכרן עם הכלים הקיימים במערכת.

לעמוד הבית של מרכז ההדרכה המעודכן - יש ללחוץ כאן

יוניקוד

יוניקוד הוא תקן שנקבע להצגת טקסט. עקב הפופולריות הרבה שלו, רוב אתרי ושירותי האינטרנט הותאמו לתקן זה וכיום הוא נחשב לתקן המקובל בעולם האינטרנט – UTF-8.
הייחוד של תקן זה מול תקנים אחרים להצגת טקסט הוא בעיקר תמיכתו הרבה בשפות בלתי סטנדרטיות (כלומר, כאלה שאינן אנגליות).

בעבר, בעלי אתרים היו עומלים על התאמת האתרים שלהם לקידודים שונים. גולשי אינטרנט מתחילת העשור ודאי זוכרים בעיות שונות בגלישה – הורדת גופנים, ההבדלים בין עברית "לוגית" לעברית "ויזואלית", התקנת גופנים בסביבת DOS ועוד. התאמה לתקן נפוץ מבטיחה תאימות מירבית לדפדפנים ולפלטפורמות גלישה שונות (לדוגמא, מכשיר סלולרי שלא עבר "גיור" או גלישה ממחשב שלא תומך בעברית).

במאמר זה נסקור את היבטי היוניקוד השונים הן מבחינת גופנים והן מבחינת היישום בכתובות.

יוניקוד וגופנים

קיימים בנמצא כ-30 גופנים בלבד המתאימים לתקן היוניקוד, מתוכם בודדים נמצאים באופן מובנה במערכות הפעלה פופולריות. הנפוצים שבהם הם Arial, Comic Sans MS, Courier New, Verdana, Times New Roman ו- Tahoma. קיימים נוספים, אך חסרה בהם התמיכה בעברית.
באופן טבעי, ברור שניתן להוסיף גופנים חדשים למערכת, אך לא בטוח להניח ששימוש בהם הוא כדאי עקב העובדה שכדי לראות את הכתוב בגופן שונה על המשתמש יהיה להתקין אותו מבעוד מועד.
בהיבט של בניית אתר, חוויית הגלישה חייבת להיות מיטבית ומרבית בעלי האתרים אינם ששים לדרוש מגולשיהם לבצע שינוי במחשבם כדי להצליח לראות את אתרם כפי שהתכוונו. מסיבה זו, מומלץ לעבוד עם סוגי הגופנים שצויינו ולהימנע מסיכון מיותר שעלול לפגוע משמעותית בחוויית הגלישה באתר.

ראוי לציין כי במסגרת הפיתוח של שפת העיצוב CSS בגרסתה האחרונה 3, מסתמנת ההוספה של היכולת לטעון דרך הקוד של האתר גופנים נוספים. על אף שהדבר פותר את נושא ההתקנה, יש לזכור שמספר הדפדפנים התומכים בפונקציות של CSS3 הוא מצומצם בשלב זה והשפה עוד לא הגיעה לתצורתה הסופית – לכן ההמלצה לעבוד עם גופנים מקובלים עומדת בעינה.

יוניקוד בכתובות
סוגיה נוספת הינה במסגרת נושא הכתובות של העמודים אשר מוצגים בעברית. עמודים שכתובתיהם נבנו במקור בעברית שאינה נכללת בתקן הוצגו בצורה בלתי תקינה לחלוטין. לדוגמא, דף הבית הפך ל ׳“׳£ ׳”׳‘׳™׳×, כלומר בליל לא מובן של תווים – שאינו קריא על ידי הדפדפן. כתוצאה מכך, קישורים שנבנו בצורות שאינן יוניקוד עלולים להישבר עבור גולש העובד תחת תצורה שונה מהתקן בו נבנה האתר. באופן הגיוני, יש להתאים את האתר למגוון רחב ככל הניתן של תרחישים.
תקן היוניקוד נותן מענה לנושא זה על ידי המרת כל תו שאינו אנגלי לקוד מסויים. לדוגמא, עברית מיוצגת על ידי הסימן D7 ואחריו קוד הקסא-דצימלי של האות (מתחיל מ-90 ומסתיים ב-AA).
לנוחיותכם, מצורפת טבלת הקוד בתחתית הסבר זה.

בכתובות בדפדפן, נכנס למשוואה עוד תו נוסף - %, המייצג רווח. כלומר האות "א'' תיוצג בכתובת תקינה כ- D7%90.
נכון, לא מדובר בייצוג הקוסמטי ביותר, אך חשוב לזכור כי דפדפנים הן מודרניים והן מיושנים תומכים תמיכה מלאה בכתובות אלו (להבדיל מתקנים אחרים שאינם נתמכים עוד). בנוסף, מבחינה קידומית, יש לזכור שמנועי החיפוש הנפוצים כוללים מתרגם מובנה (כך שגוגל, לדוגמא, לא רואה הבדל בין "א'' ל- D7 90), אך מנועי חיפוש אקזוטיים עלולים שלא לתמוך בסטנדרטים עבריים מיושנים.
לכן, שימוש בקידוד זה מבטיח תאימות מלאה לכל תצורה שהיא, גם של מנוע החיפוש.

הדוגמא הבולטת והמפורסמת ביותר בנושא של קידוד כתובות היא ויקיפדיה, האינציקלופדיה החופשית הגדולה ברשת. לצורך הדוגמא, הקישור של הערך העוסק ב"אינטרנט" נראה כך:
http://he.wikipedia.org/wiki/%D7%90%D7%99%D7%A0%D7%98%D7%A8%D7%A0%D7%98
באופן טבעי, השימוש של ויקיפדיה בקידוד זה הוא מושכל, שכן אתר זה נותן מענה לגולשים במגוון דפדפנים שונים, פלטפורמות ותצורות שונות ובאופן הזה הם דואגים לתאימות מירבית.

ניתן להיעזר בתיבה זו כדי לבחון המרות של טקסט מיוניקוד לטקסט מפורש וחזרה:



במערכת ניתן לעבור לקידוד "יוניקוד" בכתובות של עמודים דרך "רשימת הכלים" >> "פרופיל אתר" >> "הגדרת ממשק" >> סימון האפשרות "האם לקודד את שמות העמודים במערכת?" ולחיצה על "עדכן נתונים". יש לציין כי השינוי מתבצע מרגע העדכון ואילך - כלומר עמודים שנוצרו טרם השינוי לא יושפעו ממנו.

חשוב לציין כי חוסר שימוש בקידוד עמודים לא יפגע באתר - כל עוד מסתמכים על כך שהדפדפנים בהם גולשי האתר משתמשים הם עדכניים וידעו לפרש את העמודים בצורה נכונה באופן אוטומטי.
בעלי אתרים המודעים לכך שגולשיהם משתמשים בתוכנה לא עדכנית, לדוגמא באמצעות כלי סטטיסטיקה ומעקב, מוטב כי יפעילו את קידוד העמודים.

חברות ישראליות רבות המעוניינות להפוך את הקישורים לנעימים יותר לעין בונות קישורי יוניקוד, אך בעת מסירת הקישור או הצגתו, משתמשות בשירות כלשהו לקיצור כתובות, דוגמת tinyurl.com או bit.ly.


הערה חשובה:
מרבית הדפדפנים הפופולריים יודעים "לתרגם" בזמן אמת את הקישור שמופיע בשורת הכתובת לשפה ממשית וקריאה.
נכון למועד כתיבת שורות אלו, פיירפוקס וכרום יודעים להציג טקסט קריא, בעוד אקספלורר 7 ו-8 מציגים את הייצוג המספרי. ניתן להשתמש בהבדל משמעותי זה לצרכי בדיקה ומעקב.

טבלת אותיות

האות

ייצוג UTF-8

האות

ייצוג UTF-8

האות

ייצוג UTF-8
א d7 90 י d7 99 ע d7 a2
ב d7 91 ך d7 9a ף d7 a3
ג d7 92 כ d7 9b פ d7 a4
ד d7 93 ל d7 9c ץ d7 a5
ה d7 94 ם d7 9d צ d7 a6
ו d7 95 מ d7 9e ק d7 a7
ז d7 96 ן d7 9f ר d7 a8
ח d7 97 נ d7 a0 ש d7 a9
ט d7 98 ס d7 a1 ת d7 aa

 

 

 
© 2014 Livecity. All rights reserved