用PHP自动把纯文本转变成Web页面
发布时间:2022-01-17 14:11:39 所属栏目:PHP教程 来源:互联网
导读:本篇文章的内容。我将告诉你如何使用PHP来快速将纯ASCII文本完美地转换成为可读的HTML标记。 首先让我们来看一个我朋友希望转换的纯文本文件的例子: Green for Mars! John R. Doe The idea of little green men from Mars, long a staple of science fict
本篇文章的内容。我将告诉你如何使用PHP来快速将纯ASCII文本完美地转换成为可读的HTML标记。 首先让我们来看一个我朋友希望转换的纯文本文件的例子: Green for Mars! John R. Doe The idea of little green men from Mars, long a staple of science fiction, may soon turn out to be less fantasy and more fact. Recent samples sent by the latest Mars exploration team indicate a high presence of chlorophyll in the atmosphere. Chlorophyll, you will recall, is what makes plants green. It's quite likely, therefore, that organisms on Mars will have, through continued exposure to the green stuff, developed a greenish tinge on their outer exoskeleton. An interview with Dr. Rushel Bunter, the head of ASDA's Mars Colonization Project blah blah... What does this mean for you? Well, it means blah blahblah... Track follow-ups to this story online at http://www.mars-connect.dom/. To see pictures of the latest samples, log on to http://www.asdamcp.dom/galleries/220/ 相当标准的文本:它有一个标题、一个署名和很多段的文字。把这篇文档转换成为HTML真正需要做的是使用HTML的分行和分段标记把原文的布局保留在Web页面上。特殊的标点符号需要被转换成为对应的HTML符号,超链接需要变得可以点击。 下面的PHP代码(列表A)就会完成上面所有的任务: 列表A 让我们来看看它是如何工作的: 以下是引用片段: <?php // set source file name and path $source = "toi200686.txt"; // read raw text as array $raw = file($source) or die("Cannot read file"); // retrieve first and second lines (title and author) $slug = array_shift($raw); $byline = array_shift($raw); // join remaining data into string $data = join('', $raw); // replace special characters with HTML entities // replace line breaks with <br /> $html = nl2br(htmlspecialchars($data)); // replace multiple spaces with single spaces $html = preg_replace('/ss+/', ' ', $html); // replace URLs with <a href...> elements $html = preg_replace('/s(w+://)(S+)/', ' <a href="" target="_blank"></a>', $html); // start building output page // add page header $output =<<< HEADER <html> <head> <style> .slug {font-size: 15pt; font-weight: bold} .byline { font-style: italic } </style> </head> <body> HEADER; // add page content $output .= "<div class='slug'>$slug</div>"; $output .= "<div class='byline'>By $byline</div><p />"; $output .= "<div>$html</div>"; // add page footer $output .=<<< FOOTER </body> </html> FOOTER; // display in browser echo $output; // AND/OR // write output to a new .html file file_put_contents(basename($source, substr($source, strpos($source, '.'))) . ".html", $output) or die("Cannot write file"); ?> 第一步是把纯ASCII文件读取到一个PHP数组里。这通过file()函数很容易就可以完成,这个函数会把文件的每一行都转换成为一个用数字索引的数组中的元素。 然后,标题和作者行(我假设这两个都是文件的前两行)都通过array_shift()函数从数组里提取出来,放到单独的变量里。数组剩下的成员然后被连接成一个字符串。这个字符串现在就包括了整篇文章的正文。 一旦HTML页面构建完成,它就可以被送到浏览器或者用file_put_contents()保存为静态文件。要注意的是,在保存的时候,原来的文件名会被分解,一个新的文件名(叫做filename.html)会为新创建的Web页面创建。你然后就可以把这个Web页面发布到Web服务器上、保存到光盘上或者对它进行进一步编辑。 注意:在使用这个脚本创建和保存HTML文件到磁盘的时候,你要确保这个脚本对文件保存的目录有写权限。 (编辑:武汉站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |