پایتون برای همه | 34 | فایل متنی و خطوط

پایتون برای همه پایتون 3

یک فایل متنی را می‌توان سلسله‌ای از خطوط در نظر گرفت. درست مثل سلسله‌ای از کاراکترها که در پایتون یک رشته خوانده می‌شود. نوشته‌ی زیر، یک فایل متنی‌ست که فعالیت‌های مرتبط با ایمیل را از افراد متفاوت جمع‌آوری می‌کند؛ این فایل از یک پروژه‌ی متن‌باز به عاریت گرفته شده است:

From [email protected] Sat Jan 5 09:14:16 2008
Return-Path: <[email protected]>
Date: Sat, 5 Jan 2008 09:12:18 -0500
To: [email protected]
From: [email protected]
Subject: [sakai] svn commit: r39772 - content/branches/
Details: http://source.sakaiproject.org/viewsvn/?view=rev&rev=39772
...

کل فایل متنی را می‌توانید از لینک زیر دریافت کنید:
لینک

همچنین یک نسخه‌ی خلاصه‌شده‌ی آن در لینک زیر در دسترس است:
لینک

فرمت این فایل‌ها استاندارد است و شامل چندین پیام پستی می‌شود. خطوطی که با کلمه‎ ‎”From”‎ آغاز می‌شوند، پیام‌ها را جدا کرده و خطوطی که با ‎”From:‎”‎ شروع می‌شوند، قسمتی از آن پیام‌ها هستند. برای اطلاعات بیشتر در خصوص فرمت mbox این صفحه را ببیند:
لینک

برای شکستن فایل به خطوط، کاراکتر ویژه‌ای که نشان‌دهنده‌ی پایان خط است وجود دارد. این کاراکتر newline یا خط‌جدید خوانده می‌شود.

پایتون کاراکتر خط‌جدید را با یک بک‌اسلش و n مشخص می‌کند. اگرچه ‎n به نظر دو کاراکتر است، ولی در اصل یک کاراکتر خوانده می‌شود. فرض کنید که ما این کاراکتر را در داخل متغیری با نام stuff قرار می‌دهیم. حالا اگر در داخل مفسر stuff را وارد کنیم، این کاراکتر هم نمایش داده می‌شود، ولی اگر از print استفاده کنیم، رشته‌ی ما به دو خط شکسته می‌شود.

در اصل در حین چاپ کردن متغیر، شما اثر کاراکتر ‎n را خواهید دید، و نه خود کاراکتر را. برای شفاف شدن موضوع به مثال زیر دقت کنید:

>>> stuff = 'HellonWorld!'
>>> stuff
'HellonWorld!'
>>> print(stuff)
Hello
World!
>>> stuff = 'XnY'
>>> print(stuff)
X
Y
>>> len(stuff)
3

برای اینکه مطمئن شوید که ‎n تنها یک کاراکتر است بد نیست که طول رشته‌ی XnY را با پایتون اندازه بگیرید. می‌بینید که پایتون آن را سه کاراکتر در نظر می‌گیرد. در اصل ‎n یک کاراکتر به حساب آمده است.

به این صورت، و با تصور وجود یک نویسه‌ی نامرعی در پایان هر خط، انتهای خطوط در متن‌ها مشخص می‌شود. کافی‌ست که فقط آن را در ذهن خود تصویر کنید. این نویسه یا کاراکتر ناپیدا، همان ‎n است.

حرف آخر اینکه کاراکتر خط‌جدید کاراکترهای موجود در یک فایل را به خطوط جداگانه می‌شکند.

این نوشته تحت مجوز کرییتیو کامنز BY – NC و حمایت موسسه تحقیقاتی رامونا ارائه می‌شود. شما می‌توانید با توجه به مفاد این گواهی از آن استفاده کنید.

مقاله را پسندیدید؟ در صورتی که پاسخ‌تان مثبت است، می‌توانید مقاله‌ای که خواندید را به مبلغ ۱۵۰۰ تومان با فشار دادن دکمه زیر بخرید. توجه کنید که ۱۵۰۰ تومان بهای مقاله‌ای است که اکنون خواندید اما به نشان قدردانی از شمایی که مقاله را بعد از خواندن، می‌خرید، به صفحه‌ای از وب‌سایت ایلولا هدایت خواهید شد و مقاله‌های ویژه به صورت فایل PDF در دسترس شما قرار خواهد گرفت. اگر متوجه منظورم نشدید، خواهش می‌کنم مقاله را نخرید چرا که به نظر می‌رسد ما زبان هم را نمی‌فهمیم.

پرداخت شما از طریق سایت امن زرین‌پال به سایت شاپرک (زیر نظر بانک مرکزی) هدایت خواهد شد و امنیت اطلاعات شما - در صورت رعایت نکاتی که در درگاه پرداخت ذکر شده - تضمین شده است. به عنوان راه جایگزین می‌توانید پرداخت را از طریق شماره شبا IR570560080388802621820001 به نام ایمان امینی انجام دهید و رسید را به ایمیل eman.amini روی gmail.com ارسال کنید تا دسترسی به صفحه مذکور به شما اعطا شود.

ایلولا با تکیه بر فروش مقالاتی اداره می‌شود که به رایگان در اختیار شما قرار می‌گیرد. با خرید مقالات می‌توانید آن را زنده نگه دارید. دلیل عدم نمایش تبلیغات، احترام به شما و ذهن‌تان است. می‌توانید در صفحه درباره‌ی ما جزئیات آن را بخوانید.

Whatsapp Telegram
Email Facebook Google Twitter

1 دیدگاه

پاسخ دهید

ایمیل شما نمایش داده نخواهد شد