perl常见问题集(二)

weiyinchao88

浏览: 1180685 次

最近访客更多访客>>

u012363178

nowayout

haibo18

SjNm129

博主相关

博客

微博

相册

留言

关于我

文章分类

全部博客 (1435)

社区版块

存档分类

如何得知使用者正在哪个作业系统下执行我的 perl 程式？
$^O 这个变数（若使用 English 模组就是 $OSTYPE）会指出你的 perl 解译器执行档是替哪个作业系统、平台所建的。

--------------------------------------------------------------------------------

为什麽 exec() 不会传值回来？
因为这正是它所做的：它用另一个不同的程式来取代你当时所执行的。如果你的程式需要继续跑下去（这可能正是你问此问题的原因吧？），改用 system() 。

--------------------------------------------------------------------------------

如何对键盘／萤幕／滑鼠做些花样？
连接／控制键盘、萤幕和指标装置（「滑鼠」）的方法因作业系统的不同而有不同；不妨试试下列模组：

键盘
Term::Cap perl 标准内建模组
Term::ReadKey CPAN
Term::ReadLine::Gnu CPAN
Term::ReadLine:

erl CPAN
Term::Screen CPAN

萤幕
Term::Cap perl 标准内建模组
Curses CPAN
Term::ANSIColor CPAN

滑鼠
Tk CPAN

--------------------------------------------------------------------------------

如何向使用者询问密码？
（这个问题跟全球资讯网一点关系也没有。如果你要找的是跟 WWW 有关的，那就看另一份常见问题集吧。）

【译注：中文版的 Perl CGI 程式设计常见问题集可以在下列网址中找到： http://www.math.ncu.edu.tw/~chenym/FAQ/Perl/perl-cgi-faq/
http://2tigers.net/perl/perl-cgi-faq-chi/ 】

在 crypt 里面有个范例。首先，将你的终端机设为「无回应」[no echo] 模式，然後就用平常的方法将密码读入。你可以用老式的 ioctl() 函数、 POSIX 终端机控制函数（参看 POSIX ，和 Camel 书第七章），或是呼叫 stty 程式，这些方法的可携性／移植性程度都不一样。

你也可以在大部份系统上使用 CPAN 里的 Term::ReadKey 模组，这个模组较易使用而且理论上也较据可携性／移植性。

--------------------------------------------------------------------------------

如何对序列埠做读写动作？
这端看你在什麽作业系统上执行你的程式。以 Unix 来说，序列埠可以透过 /dev 目录下的档案来撷取; 而在其他系统上，设备的名称无疑地会不一样。以下是一些在设备互动时可能遭遇的共同问题：

锁档 (lockfiles)
你的系统可能会使用锁档来控制多重读写的情况。确定你用的是正确的协定。因为当多个程序同时对一个装置做读取时可能会发生意想不到的情况。
开档模式
如果你打算对一个装置同时做读与写的动作，你得将它开到更新的模式（在 open 里有更详细的解说）。如果你不希望冒着阻挡其他程序读取这个装置的风险，那就得用 sysopen() 和 Fcntl 模组（标准 perl 的一部分）内的 O_RDWR|O_NDELAY|O_NOCTTY。在 sysopen 里有对此方法更详尽的解说。
档案尾
有些装置会等着在每行结尾处看到一个 ``/r''，而非 ``/n''。在某些平台上的 perl， ``/r''和 ``/n'' 与它们平常（在 Unix 上）所指的 ASCII 值 ``/015'' 和 ``/012'' 有所不同。你也许得直接给定数值，例如用八进位 (``/015'')、十六进位 (``0x0D'')，或指定控制字元 (``/cM'')。
print DEV "atv1/012"; # 对某些装置来说是错误的
print DEV "atv1/015"; # 对某些装置来说是对的

尽管对普通的文字档案，一个 ``/n'' 便可解决断行的问题，但目前在不同作业系统间（Unix、DOS/Win 和 Macintosh），对於断行记号仍无统一标准，而只有用 ``/015/012'' 来当成每行的结尾，然後再视需要去掉输出中不想要的部份。这个做法尤其常用於 socket输出／输入与自动洗清 (autoflushing)，也是接下来要讨论的主题。

洗清输出
如果你希望 print() 的时候每个字元都要送到你指定的装置去，那你应自动清洗你的档案把手，旧方法是：
use FileHandle;
DEV->;autoflush(1);

比较新的方法是：

use IO::Handle;
DEV->;autoflush(1);

你可以用 select() 和 $| 变数来控制自动清洗的动作（参考 $| 和select ）：

$oldh = select(DEV);
$| = 1;
select($oldh);

你也可能看到不使用额外的暂存变数的写法，例如：

select((select(DEV), $| = 1)[0]）;

如同前一个项目所说的，这方法对 Unix 和 Macintosh 间的 socket 输出／入没用。在这种情况下，你得把你的行末字元写死在程式码内。

不挡式输入 (non-blocking input)
如果你正在做一个具阻挡性的 read() 或 sysread() 动作，则你需要安排一个闹铃把手或提供一个逾时设定（参看 alarm）。如果你是用非阻挡式的开档，那麽就要配合非阻挡性的读取，也就是说得用到4 个参数的 select() 来确定此装置的输出／入是否已准备好了（参考 select ）。

--------------------------------------------------------------------------------

如何逆解加密後的密码档案？
花大把大把的钱去买破解专用的硬体，这会让你成为焦点话题。

说正经的，如果是碰到 Unix 密码档的话就不行 - Unix 密码系统用的是单向的加密函数。像 Crack 之类的程式可以暴力地（并聪明地）试着猜出密码，但无法（也不能）保证速战速决。

如果你耽心的是使用者选取不良的密码，你应该在使用者换密码时主动审核（例如说修改 passwd(1) 程式加入这个功能）。

--------------------------------------------------------------------------------

如何启动一个背景执行的程序？
你可以使用：

system("cmd &"

或是用 fork，像 fork 里写的（在 perlipc 里有更进一步的范例）。如果你在 Unix 类的系统上的话，请注意以下几件事情：

STDIN, STDOUT 和 STDERR 是共享的
主程序和背景程序（即「子」程序）共用同一个 STDIN、STDOUT 和 STDERR 档案把手。如果两个程序想同时去读、写同一个档案把手，就可能有怪事会发生。你也许应该替子程序关闭或重新开启这些把手。你可以用开启一个管道 (pipe) 的方法避免这些问题（参看 open）但是在某些系统上这样做会强迫子程序必须比父程序早死。
讯号
SIGCHLD、可能还有 SIGPIPE 这两个讯号要抓到。当背景程序执行完成後就会送出 SIGCHLD 讯号。而当你写入一个子程序已经关闭的档案把手时就会收到 SIGPIPE 讯号（一个未抓住的 SIGPIPE 可能导致你的程式无声无息地死去）。用 system("cmd&"

的话不会有这样的问题。
僵程序
你得做准备，在子程序结束时「收成」它：
$SIG{CHLD} = sub { wait };

在 Signals 有范例程式教你怎麽做。用 system("prog &"

的话不会有僵程序的问题。

--------------------------------------------------------------------------------

如何捕捉控制字元／讯号？
你并不能真的 ``捕捉'' 一个控制字元。而是控制字元产生一个讯号让你捕捉。关於讯号的资料可以在 Signals 以及 Camel 书第六章里找到。

要小心的是，大多 C 程式库无法重新进入 [re-entrant]。因此当你要尝试着在一个处理器里做 print() 动作，而这个处理器是由另一个stdio 的动作所叫出来的话，你的内部结构可能会处於失调状态，而程式可能会丢出记忆核心 (dump core)。有的时候你可以用 syswrite() 取代 print() 以避免这个状况。

除非你极为小心，否则在一个讯号处理器中，唯一安全可做的是：设定一个变数後离开。而在第一个情况下，你在设定变数的时候应确定 malloc() 不会被叫出来（譬如，设定一个已经有值的变数）。

例如：

$Interrupted = 0; # 确定它有个值
$SIG{INT} = sub {
$Interrupted++;
syswrite(STDERR, "哇/n", 5);
}

然而，因为系统呼叫会自己重新启动，你将会发现如果你用的是「慢的」呼叫，像、read()、connect() 或 wait()，那麽将它们停下的唯一办法是使用「跳远」的方式跳出来；也就是产生一个例外讯号。参看在 Signals 里对阻挡性 flock() 的逾时处理器的说明，或骆驼书第六章。

--------------------------------------------------------------------------------

如何更动 Unix 系统上隐式密码档 (shadow password) 的内容？
如果你的 perl 安装正确的话，在 perlfunc 里描述的 getpw*() 函数应该就能够读取隐式密码档了（只有读取权）。要更动该档案内容，做一个新的密码档（这个档案的格式因系统而异，请看 passwd(5) ）然後用 pwd_mkdb(

（参考 pwd_mkdb(5)）来安装新的密码档。

--------------------------------------------------------------------------------

如何设定时间和日期？
假设你有足够的权限，你应该可以用 date(1) 程式来设定系统的时间与日期。（但没有针对个别程序修改时间日期的方法）这机制在 Unix、MS-DOS、Windows 和 NT 下都能用；VMS 下则要用 set time 。

然而，如果你只是要更动你的时区，只消设定一个环境变数即可：

$ENV{TZ} = "MST7MDT"; # unix 下
$ENV{'SYS$TIMEZONE_DIFFERENTIAL'}="-5" # vms
system "trn comp.lang.perl";

--------------------------------------------------------------------------------

如何能够针对小於一秒的时间做 sleep() 或 alarm() 的动作呢？
如果你要比 sleep() 所提供的最小单位一秒更精细的话，最简单的方法就是用 select 里面写的 select() 函数。如果你的系统有 itimers 并支援syscall()，你可以试试下面这个老范例 http://www.perl.com/CPAN/doc/misc/ancient/tutorial/eg/itimers.pl .

--------------------------------------------------------------------------------

如何测量小於一秒的时间？
一般来说，你可能做不到。 Time::HiRes 模组（CPAN 有）在某些系统上能达到此功能。

总之，你可能做不到。但是如果你的 Perl 支援 syscall() 函数并支援类似 gettimeofday(2) 的系统呼叫，你也许可以这麽做：

require 'sys/syscall.ph';

$TIMEVAL_T = "LL";

$done = $start = pack($TIMEVAL_T, ());

syscall( &SYS_gettimeofday, $start, 0)) != -1
or die "gettimeofday: $!";

##########################
# 在这做你要做的事 #
##########################

syscall( &SYS_gettimeofday, $done, 0) != -1
or die "gettimeofday: $!";

@start = unpack($TIMEVAL_T, $start);
@done = unpack($TIMEVAL_T, $done);

# fix microseconds
for ($done[1], $start[1]) { $_ /= 1_000_000 }

$delta_time = sprintf "%.4f", ($done[0] + $done[1] )
-
($start[0] + $start[1] );

--------------------------------------------------------------------------------

如何做 atexit() 或 setjmp()/longjmp() 的动作？（例外处理）
第五版的 Perl 增加了 END 区块，可以用来模拟 atexit()的效果。当程式或执行绪(thread) 终了时就会去呼叫该包装的 END 区块（参考 perlmod 文件）。但是如果当程式被没有抓到的讯号终结了，END 区块就不会被呼叫到，所以当你用 END 时应再加上

use sigtrap qw(die normal-signals);

Perl 的例外处理机制就是它的 eval() 运算子。你可以把 eval() 当做 setjmp 而die()当做 longjmp 来使用。更详细的说明请参考 Signals 和 Camel书第六章里关於讯号的那段，尤其是描述有关 flock() 的逾时处理器那段。

如果你只对例外处理的部分有兴趣，试试 exceptions.pl 程式库（包含在标准 perl里）。

如果你要的是 atexit() 语法（以及 rmexit()），试试 CPAN 里的 AtExit 模组。

--------------------------------------------------------------------------------

为何我的 sockets 程式在 System V (Solaris) 系统下不能用？「不支援本协定」这个错误讯息又是什麽意思？
有些 Sys-V 根底的系统，特别像 Solaris 2.X，已重新将一些标准的 socket常数定义过了。由於这些常数在各种架构下都是定值，所以在 perl程式码中常被人写死在里面。处理此问题的适当方式是用 ``use Socket'' 来取得正确的值。

须注意尽管 SunOS 和 Solaris 在二进位执行档上相容，这些值是相异的。自己去想为什麽吧。

--------------------------------------------------------------------------------

如何从 Perl 里呼叫系统中独特的 C 函数？
通常是写个外部的模组来处理 - 参看「我要如何学到将 C 与 Perl 连结在一起？ [h2xs, xsubpp]」这问题的答案。然而，如果此函数是个系统呼叫，而你的系统有支援 syscall()，那麽可以用 syscall 函数（说明在 perlfunc 里）。

切记先查查看你的 perl 版本中所附的模组以及 CPAN 里的模组，因为也许某人已经写了个这样的模组。

--------------------------------------------------------------------------------

在哪里可以找引入档来做 ioctl() 或 syscall()？
以前这些档案会由标准 perl 发行中所附的 h2ph 工具来产生。这个程式将 C 标头档案里的 cpp(1)指令转换成内含副程式定义的档案，像 &SYS_getitimer，你可以把它当做函数的参数。这样做并不怎麽完美，但通常可达成任务。简单的像 errno.h 、syscall.h 和socket.h 这些档案都没问题，但像 ioctl.h 这种较难的档案总是需要人工编辑。以下是安装 *.ph 档案的步骤：

1. 进入最高使用者帐户
2. cd /usr/include
3. h2ph *.h */*.h

如果你的系统支援动态载入，那麽为了可携性、而且合理的做法是使用 h2xs（也是 perl的标准配备）。这个工具将 C 标头档案转换成 Perl 的衍伸档案 (extensions)。 h2xs 的入门要看 perlxstut 。

如果你的系统不支援动态载入，你可能仍应使用 h2xs。参看 perlxstut 和 MakeMaker （简单来说，就是用 make perl 、而非 make来重建一份使用新的静态连结的 perl）。

--------------------------------------------------------------------------------

为何 setuid perl 程式会抱怨关於系统核心的问题？
有些作业系统的核心有臭虫使得 setuid 程式在先天上就不安全。Perl提供你一些方法（在 perlsec 里有写）可跳过这些系统的缺陷。

--------------------------------------------------------------------------------

如何打开对某程式既输入又输出的管道 (pipe)？
IPC::Open2 模组（perl 的标准配件）是个好用的方法，它在内部是藉着pipe()、 fork() 和 exec() 来完成此工作。不过切记要读它文件里关於锁死的警告 ( Open2 )。

--------------------------------------------------------------------------------

为何用 system() 却得不到一个指令的输出呢？
你把 system() 和反向引号 (``) 的用法搞混了。 system() 会执行一个指令然後传回指令结束时的状况资讯（以一个 16 进位值表示：低位元是程序中止所收到的讯号，高位元才是真正离开时的传回值）。反向引号 (``) 执行一个指令并且把它所送出的东西送到 STDOUT。

$exit_status = system("mail-users"

;
$output_string = `ls`;

--------------------------------------------------------------------------------

如何补捉外部指令的 STDERR？
有叁种基本方式执行外部指令：

system $cmd; # 使用 system()
$output = `$cmd`; # 使用反向引号 (``)
open (PIPE, "cmd |"

; # 使用 open()

在 system() 下，STDOUT 和 STDERR 都会输出到和 script 本身的 STDOUT, STDERR相同的出处，除非指令本身将它们导向它处。反向引号和 open() 则只读取指令的 STDOUT 部份。

在上述方法中，你可以在呼叫前更改档案描述元 (file descriptor) 名称：

open(STDOUT, ">;logfile"

;
system("ls"

;

或者使用 Bourne shell 的档案描述元重导功能：

$output = `$cmd 2>;some_file`;
open (PIPE, "cmd 2>;some_file |"

;

也可以用档案描述元重导功能将 STDERR 导向到 STDOUT：

$output = `$cmd 2>;&1`;
open (PIPE, "cmd 2>;&1 |"

;

注意你不能光是将 STDERR 开成 STDOUT 的复制，而不呼叫 shell来做这个重导的工作。这样是不行的：

open(STDERR, ">;&STDOUT"

;
$alloutput = `cmd args`; # stderr 仍然会跑掉

失败的原因是，open() 让 STDERR 在呼叫 open() 时往 STDOUT的方向走。然後反向引号让 STDOUT的内容跑到一个字串变数里，但是没有改变 STDERR 的去向（它仍然往旧的 STDOUT那里跑）。

注意，在反向引号里你必须使用 Bourne shell (sh(1)) 重导的语法而非 csh(1)的！至於为何 Perl 的 system()、反向引号和开管道都用 Bourne shell语法的原因，可在下址找到： http://www.perl.com/CPAN/doc/FMTEYEWTK/versus/csh.whynot

你也可以使用 IPC::Open3 模组（perl 标准配备），但注意它的参数顺序和 IPC::Open2不一样（参看 Open3 ）。

--------------------------------------------------------------------------------

为何当管道开启失败时 open() 不会传回错误讯息？
其实会，只是或许并非以你期望的方式。在遵循标准 fork()/exec() 机制的系统上（例如，Unix），运作原理是这样的：open() 导致一个 fork()。在父程序里， open()传回子程序的ID。然後子程序 exec() 从管道传来／出的指令。父程序无法得知 exec() 的动作成功与否－它能传回的只有 fork() 动作成功与否的消息。要找出这指令是否顺利执行，你得补捉 SIGCHLD讯号并 wait() 以得到子程序离开时的状态。如果你要写资料到子程序，则 SIGPIPE也该一并捕捉－否则在你写入之前可能无法察觉 exec() 动作已失败了。这些在 perlipc 文件里都有说明。

在使用 spawn() 机制的系统里，open() 也许能达到你所期望的－除非 perl 使用一个 shell 来起始你的指令。在这情况下以上对 fork()/exec() 的描述仍适用。

--------------------------------------------------------------------------------

在输出值是空的情境里使用反向引号有何不对？
严格说起来，没啥不对。但从程式写作严谨与否来说，这样无法写出较易维护的程式码，因为反向引号有一个（可能很巨大的）传回值，而你却忽略它。同时这也是缺乏效率的方法，因为你得把每行所有的输出读进来、留一块记忆体给它们，然後再把它们丢开。人们常常做下列这种事：

`cp file file.bak`;

然後它们就会想：「嘿，乾脆以後都用反向引号来执行程式好了。」这是馊主意，因为反向引号的目的在补捉程式的输出；system() 函数才是用来执行程式的。

再看看下列这一行：

`cat /etc/termcap`;

你还没有指定输出，所以它会浪费记忆体（就那麽一下子)。另外你也忘了检查 $? 看看程式是否正确的执行。即使你写成

print `cat /etc/termcap`;

但在大部份情况下，这本来可以、而且也应该写成

system("cat /etc/termcap") == 0
or die "cat program failed!";

这样可快速地得到输出（一产生出来就会得到，不用等到最後），并且检查传回值。

system() 同时具有直接决定是否先做 shell 万用字元 (wildcard)处理的功能，反向引号就不行。

--------------------------------------------------------------------------------

如何不经过 shell 处理来呼叫反向引号？
这需要些技巧。本来是写成

@ok = `grep @opts '$search_string' @filenames`;

你得改成：

my @ok = ();
if (open(GREP, "-|")) {
while () {
chomp;
push(@ok, $_);
}
close GREP;
} else {
exec 'grep', @opts, $search_string, @filenames;
}

一如 system()，当你 exec() 一个序列时不会有 shell 解译的情况发生。

--------------------------------------------------------------------------------

为何给了 EOF（Unix 上是 ^D，MS-DOS 上是 ^Z）後我的程式就不能从 STDIN 读取东西了呢？
因为某些 stdio 的 set error 和 eof 旗标需要清除。你可以用 POSIX 模组里定义的clearerr()。这是在技术上正确的解决之道。还有一些较不保险的方法：

试着保存搜寻指标然後去找它，例如：
$where = tell(LOG);
seek(LOG, $where, 0);

如果那样行不通，试着去 seek() 档案的另一部份然後再找回来。
如果还是行不通，试着 seek() 档案另一个相异的的部份，读点东西，再回去找。
如果依然不行，放弃使用 stdio 改用 sysread。

--------------------------------------------------------------------------------

如何把 shell 程式转成 perl？
学习 Perl 然後重写。说真的，没有简单的转换方式。用 shell 做起来很笨的工作可以用 Perl 很轻松的做到，而就是这些麻烦之处使得 shell->;perl 转换程式非常不可能写得出来。在重新撰写程式的过程里，你会认清自己真正要做的工作为何，也希望能够跳脱 shell 的管线资料流机制 [pipeline datastream paradigm]，这东西虽对某些事情很方便，但也常造成低效率。

--------------------------------------------------------------------------------

perl 能处理 telnet 或 ftp 这种双向互动吗？
试试 Net::FTP、TCP::Client 和 NET::Telnet 模组（CPAN 有）。 http://www.perl.com/CPAN/scripts/netstuff/telnet.emul.shar也有助於模拟 telnet 协定，但是 Net::Telnet 可能较容易使用。

如果你所要做的只是假装 telnet 但又不要起始 telnet 时的沟通程序，那麽以下这个标准的双程序方式就可以满足你的需要了：

use IO::Socket; # 5.004 才有的新模组
$handle = IO::Socket::INET->;new('www.perl.com:80')
|| die "无法接上 www.perl.com 的 port 80： $!";
$handle->;autoflush(1);
if (fork()) { # XXX: undef 表示失败
select($handle);
print while ; # 将所有从 stdin 来的丢到 socket
} else {
print while ; # 将所有 socket 来的丢到 stdout
}
close $handle;
exit;

--------------------------------------------------------------------------------

如何在 Perl 里达到 Expect 的功能？
很久很久以前，有个叫做 chat2.pl 的程式库（perl 标准配备之一），但一直没真正完工。现在，你的最佳选择就是从 CPAN 来的 Comm.pl 程式库。

--------------------------------------------------------------------------------

有没有可能将 perl 的指令列隐藏起来，以躲避像 "ps" 之类的程式？
首先要注意的是，如果你的目的是为了安全（例如避免人们偷看到密码），那你应该重写你的程式，把重要的资讯从参数中剔除。光是隐藏起来不会让你的程式变得完全安全。

如要真的把看得见的指令列改掉，你可以设定 $0 这个变数值，如同 perlvar 里写的。但这方法并非各种作业系统都适用。像 sendmail之类的背景程式 (daemons) 就将它们的状态放在那儿：

$0 = "orcus [accepting connections]";

--------------------------------------------------------------------------------

我在 perl script 里 {更动目录，更改我的使用环境}。为何这些改变在程式执行完後就消失了呢？如何让我做的修改显露出来？
Unix
严格的说起来，这是做不到的－一个 script 的执行是从启动它的 shell 生出一个不同的程序来执行。这个程序的任何变动不会反映到它的父程序，只会反映到更改之後它自己创造出来的子程序。有个 shell 魔术可以让你藉着在 shell 里 eval()你 script 的输出来装出这种效果，在 comp.unix.questions FAQ 里有详细内容。
VMS
对 %ENV 的更改会持续到 Perl 离开，但是目录更动则不会。

--------------------------------------------------------------------------------

如何关闭一个程序的档案把手而不用等它完成呢？
假设你的系统支援这种功能，那就只要送个适当的讯号给此程序（参看 kill）。通常是先送一个 TERM 讯号，等一下下，然後再送个 KILL 讯号去终结它。

--------------------------------------------------------------------------------

如何 fork 出一个背景执行 (daemon) 程序？
如果你所指的是离线的程序（未与 tty 连线者），那下列的程序据说在大部份的 Unix系统都能用。非 Unix 系统的使用者应该检查 Your_OS:

rocess 模组看看有没有其他的解决方案。

打开 /dev/tty 然後对它用 TIOCNOTTY ioctl。请参考 tty(4) 。
把目录换到 /
重开 STDIN、STDOUT 和 STDERR 使它们不会与旧的 tty 连接。
用下列方法把程式丢到背景：
fork && exit;

--------------------------------------------------------------------------------

如何使我的程式和 sh 及 csh 一起执行？
参看 eg/nih 这 script（perl 原始码发行的一部分）。

--------------------------------------------------------------------------------

如何得知我是否正在互动模式下执行？
问得好。有的时候 -t STDIN 和 -t STDOUT 可以提供线索，有时不行。

if (-t STDIN && -t STDOUT) {
print "Now what? ";
}

在 POSIX 系统中，你可以用以下方法测试你自己的程序群组与现在控制你终端机的是否相同：

use POSIX qw/getpgrp tcgetpgrp/;
open(TTY, "/dev/tty") or die $!;
$tpgrp = tcgetpgrp(TTY);
$pgrp = getpgrp();
if ($tpgrp == $pgrp) {
print "前景/n";
} else {
print "背景/n";
}

--------------------------------------------------------------------------------

如何让一个缓慢的事件过时？
如同 Signals 和 Camel 书第六章里所描述的，用 alarm() 函数，或许再配合上一个讯号处理器。你也可以改用 CPAN 里更具弹性的 Sys::AlarmCall 模组来做。

--------------------------------------------------------------------------------

如何设定 CPU 使用限制？
使用 CPAN 里的 BSD::Resource 模组。

--------------------------------------------------------------------------------

在 Unix 系统上如何避免产生僵程序 (zombies)？
使用 Signals 里面叫 reaper 的程式码，在接到 SIGCHLD 时会呼叫wait()，或是用 fork 里面写的双 fork 技巧。

--------------------------------------------------------------------------------

如何使用一个 SQL 资料库？
有几个连接 SQL 资料库非常好的界面。参看 http://www.perl.com/CPAN/modules/dbperl/DBD 里的 DBD::* 模组。

--------------------------------------------------------------------------------

如何让 system() 在收到 control-C 後就离开？
做不到。你需要摹仿 system() 呼叫（参看 perlipc 里的范例程式），然後设计一个讯号处理器，让它把 INT 讯号传给子程序。

--------------------------------------------------------------------------------

如何开启一个档案但不阻挡其他程序的阅读？
如果你有幸使用到支援非阻挡性读取的系统（大部份 Unix 般的系统都有支援），你只需要用 Fcntl 模组里的 O_NDELAY 或 O_NONBLOCK 旗标，配合 sysopen()：

use Fcntl;
sysopen(FH, "/tmp/somefile", O_WRONLY|O_NDELAY|O_CREAT, 0644)
or die "can't open /tmp/somefile: $!";

--------------------------------------------------------------------------------

如何安装一个 CPAN 模组？
最简单的方法就是让 CPAN 这个模组替你代劳。这个模组包含在 5.004及以後的版本中。如要手动安装 CPAN 模组，或是任何按规矩发展的 CPAN模组，遵循以下步骤：

把原始码解开放到一个暂存区域
perl Makefile.PL

make

make test

make install

如果你用的 perl 版本在编译时没有建入动态连结的功能，那你只消把第叁步 (make)换成 make perl 然後你就会得到一个新的 perl 执行档，里头连有你新加入的延伸。

在 MakeMaker里面有更多关於建构模组的细节，并参考「如何保有一份自己的模组／程式库目录？」这个问题。

--------------------------------------------------------------------------------

如何保有一份自己的模组／程式库目录？
当你建构模组时，在产生 Makefiles 时使用 PREFIX 选项：

perl Makefile.PL PREFIX=/u/mydir/perl

然後在执行用到此模组／程式库的程式前先设好 PERL5LIB 环境变数（参考 perlrun ），或是用

use lib '/u/mydir/perl';

进一步的资料可在 Perl 的 lib 手册中找到。

--------------------------------------------------------------------------------

如何把我的程式所在位置加入模组／程式库搜寻路径？
use FindBin;
use lib "$FindBin:Bin";
use your_own_modules;

--------------------------------------------------------------------------------

如何在执行时添加目录到自己的引入路径中？
以下是我们建议更动引入路径的方法：

PERLLIB 环境变数
PERL5LIB 环境变数
perl -Idir 指令列参数
use lib pragma, as in
use lib "$ENV{HOME}/myown_perllib";

後者特别有用，因为它知道与机器相关的架构。lib.pm 机制模组是从 5.002 版开始包含在 Perl 里面的。

--------------------------------------------------------------------------------

如何从终端机一次抓进一个按键？如果用 POSIX 模组时又该怎麽做？
#!/usr/bin/perl -w
use strict;
$| = 1;
for (1
exit;

BEGIN {
use POSIX qw(:termios_h);

my ($term, $oterm, $echo, $noecho, $fd_stdin);

$fd_stdin = fileno(STDIN);

$term = POSIX::Termios->;new();
$term->;getattr($fd_stdin);
$oterm = $term->;getlflag();

$echo = ECHO | ECHOK | ICANON;
$noecho = $oterm & ~$echo;

sub cbreak {
$term->;setlflag($noecho);
$term->;setcc(VTIME, 1);
$term->;setattr($fd_stdin, TCSANOW);
}

sub cooked {
$term->;setlflag($oterm);
$term->;setcc(VTIME, 0);
$term->;setattr($fd_stdin, TCSANOW);
}

sub getone {
my $key = '';
cbreak();
sysread(STDIN, $key, 1);
cooked();
return $key;
}

}
END { cooked() }

我的 CGI script可在指令列下执行但无法从浏览器执行。您能不能帮我修修看？
当然，但您恐怕付不起雇我们的签约金

说真的，如果您能够先证明您已读过下列这几个 FAQs ，但遇到的问题并不单纯、非叁言两语即可回答的话，那麽您 post到 comp.infosystems.www.authoring.cgi上（如果是有关 HTTP 、 HTML ，或 CGI通信协定）的问题可能也会得到口气和缓而有用的答覆。表面上看似 Perl，但骨子里是 CGI之类的问题，如果 post到 comp.lang.perl.misc人家可能就不会这麽乐意地接受了。

几个实用的 FAQs 分别是：

http://www.perl.com/perl/faq/idiots-guide.html
http://www3.pair.com/webthing/docs/cgi/faqs/cgifaq.shtml
http://www.perl.com/perl/faq/perl-cgi-faq.html
http://www-genome.wi.mit.edu/WWW/faqs/www-security-faq.html
http://www.boutell.com/faq/

【译者】上面第叁份文件，Perl-CGI-FAQ的中译版可在 http://2Ti.com/cgi-bin/2T/perl/perl-cgi-faq-chi/ 处取得。最後一份（WWW FAQ）的中译版可自 http://www.acer.net/document/cwwwfaq/ 取得。

--------------------------------------------------------------------------------

如何去除文章中的 HTML标签？
最正确（尽管不是最快）的方法是使用 HTML:

arse模组（可由 CPAN取得，是所有写 Web程式者必备的 libwww-perl 套件的一部分）。

许多人尝试用简陋的正规表示式来解决这个问题，譬如说像 s///g，但这个式子在很多情况下会失败，因为要处理的字串可能会跨越断行字元，也可能含有被 quote【跳脱】的箭头号，或有 HTML comment出现；再加上一些疏忽，譬如，人们常忘了转换如 '"]*|(['"]).*?/1)*>;//gs

如果您想要更完整的解法，请看叁部曲的 striphtml 程式， http://www.perl.com/CPAN/authors/Tom_Christiansen/scripts/striphtml.gz 。

--------------------------------------------------------------------------------

如何萃取 URLs？
一个快速但不完美的做法是

#!/usr/bin/perl -n00
# qxurl - tchrist@perl.com
print "$2/n" while m{

}gsix;

这个版本并不替相对式写法的 URLs 作调整，也不懂代换 bases【】，或如何处理 HTML comments、同时处理同一个标签里的 HREF和 NAME 属性，或接受 URL形式的参数。同时，它要比一个较「完整」、利用 LWP [libwww-perl]模组套件的解法，例如 http://www.perl.com/CPAN/authors/Tom_Christiansen/scripts/xurl.gz这个程式，快上一百倍。

--------------------------------------------------------------------------------

如何从 user端上传资料？如何在另一台机器上开一个档案？
如果是 HTML表格的话，您可以使用 multipart/form-data的编码格式。 CGI.pm（可自 CPAN取得）中的 start_multipart_form()这个 method 就是为此设计的，它和 startform()这个 method 是两回事。

--------------------------------------------------------------------------------

如何在 HTML中做 pop-up menu（跳出式选单）？
用和这两个标签。 CGI.pm模组（可由 CPAN取得）对这个 widget【此指跳出式选单这个介面成分】还有许多其他的介面成分都有支援【即有制作动态标签的函式】，其中有些是以巧妙模拟的方式达成。

--------------------------------------------------------------------------------

如何抓 HTML档案？
有一个方法是，如果您的系统上装有 lynx一类的文字模式的 HTML浏览器的话，那麽可以这麽做：

$html_code = `lynx -source $url`;
$text_data = `lynx -dump $url`;

收录在 CPAN里的 libwww-perl (LWP)模组则提供了更强的方法来做这件事。它不但可钻过 proxies，而且也不需要 lynx：

# print HTML from a URL
use LWP::Simple;
getprint "http://www.sn.no/libwww-perl/";;

# print ASCII from HTML from a URL
use LWP::Simple;
use HTML:

arse;
use HTML::FormatText;
my ($html, $ascii);
$html = get("http://www.perl.com/"

;
defined $html
or die "Can't fetch HTML from http://www.perl.com/";;
$ascii = HTML::FormatText->;new->;format(parse_html($html));
print $ascii;

--------------------------------------------------------------------------------

如何解开或产生 Web上那些冠 %的码？
以下是一个解码的实例：

$string = "http://altavista.digital.com/cgi-bin/query?pg=q&;what=news&fmt=.&q=%2Bcgi-bin+%2Bperl.exe";
$string =~ s/%([a-fA-F0-9]{2})/chr(hex($1))/ge;

编码比较困难一点，因为您不能盲目地把所有非字母数字的字元 (/W)都一律转换成十六进位的跳脱码。很重要的是有特殊意义的字元，如 / 和 ? 便不可以转换。要做得正确，最简单的方法大概是使用现成的 URI::Escape模组，而不要重新发明轮子。这个模组是 libwww-perl 套件 (LWP)的一部分，可自 CPAN取得。

--------------------------------------------------------------------------------

如何【将 requests】转向到另一页去？
在您的回应中不要使用 Content-Type这个标头，相反地，用 Location: 这个标头。按正式规定，应当 URL: 才是正确的标头。因此 CGI.pm模组（可由CPAN取得）两个标头都送：

Location: http://www.domain.com/newpage
URI: http://www.domain.com/newpage

要注意的是，由於 servers采用「最高效率化」的运作方式，故在这些标头中如果使用相对式的 URLs可能会产生奇怪的後果。

--------------------------------------------------------------------------------

如何替网页加上密码？
不一定，要看情况。您需要读您 server的使用手册，或者查查看上头所列的几个 FAQs。

--------------------------------------------------------------------------------

要怎麽用 Perl来编辑 .htpasswd和 .htgroup这两个档案？
HTTPD::UserAdmin 和 HTTPD::GroupAdmin等模组为这些档案提供了统一的物件导向介面，尽管这些档案可能以各种不同的格式储存。这些资料库可能是纯文字格式、 dbm、Berkeley DB或任何 DBI相容的资料库驱动程式 (drivers)。 HTTPD::UserAdmin支援`Basic' 和 `Digest'这两个认证模式所用的档案。以下是一例：

use HTTPD::UserAdmin ();
HTTPD::UserAdmin
->;new(DB =>; "/foo/.htpasswd"

->;add($username =>; $password);

--------------------------------------------------------------------------------

如何防范使用者藉由填我的 CGI表格来做坏事？
阅读 CGI security FAQ，（可在 http://www-genome.wi.mit.edu/WWW/faqs/www-security-faq.html取得），还有 Perl CGI FAQ，在 http://www.perl.com/CPAN/doc/FAQs/cgi/perl-cgi-faq.html 。

简单一句话：使用 tainting（沾腥？）这项功能（详见 perlsec ）。它会让所有不在您的 script中、来路不明的资料（譬如， CGI参数）无法放到 eval 或 system等呼叫中使用。除了使用 tainting之外，绝对不要使用单一参数的方式下参数给 system()或 exec()，而应将欲执行的指令及其参数放在一个序列或阵列里面，再传给 system()或 exec()，这样便可避免 globbing【即被 shell先做解译】。

--------------------------------------------------------------------------------

如何解读、萃取 email标头资料？
如果您只需要一个「快而脏」的解法的话，您可以试试这个从再版的 ``Programming Perl''第 222页中拿出来的例子：

$/ = '';
$header = ;
$header =~ s//n/s+/ /g; #将延续行合并成单行
%head = ( UNIX_FROM_LINE, split /^([-/w]+):/s*/m, $header );

譬如说，您若想保留所有 Received栏位资料的话【因 Received栏位通常不止一个】，这个解法便不太行了。一个完整的解法是使用收录在 CPAN的 Mail::Header模组（ MailTools 套件的一部分）。

--------------------------------------------------------------------------------

如何解译 CGI表格？
很多人忍不住要自己写程式来处理这部分的工作，所以您们大概都看过一大堆其中有 $ENV{CONTENT_LENGTH} 和 $ENV{QUERY_STRING}的程式码。没错，这麽写是可以行得通，但事实上也有很多在网路上出没的这类程式根本不能用！

请不要忍不住去重新发明轮子【译者：这是英文的说法 (reinventing the wheels)，也就是浪费时间做人家做过的事的意思】。请改用 CGI.pm或 CGI_Lite.pm（可自 CPAN取得）。如果您被困在无模组的 perl1 .. perl4的土地上，您可以试看看 cgi-lib.pl（可至 http://www.bio.cam.ac.uk/web/form.html取得）。

--------------------------------------------------------------------------------

如何验证 email位址？
无法度。

如果没有寄封信到一个位址去试试看它会不会弹回来（即使是这麽做您还得面对停顿的问题），您是无法确定一个位址是否真的存在的。即使您套用 email 标头的标准规格来做检查的依据，您还是有可能会遇到问题，因为有些送得到的位址并不符合 RFC-822（电子邮件标头的标准）的规定，但有些符合标准的位址却无法投递。

许多人试图用一个简单的正规表示式，例如 /^[/w.-]+/@([/w.-]/.)+/w+$/来消除一些通常是无效的 email位址。不过，这样做也把很多合格的位址给一起滤掉了，而且对测试一个位址有没有希望投递成功完全没有帮助，所以在此建议大家不要这麽做；不过您可以看看： http://www.perl.com/CPAN/authors/Tom_Christiansen/scripts/ckaddr.gz。这个 script真的彻底地依据所有的 RFC规定来做检验（除了内嵌式 comments外）,同时会排除一些您可能不会想送信去的位址（如 Bill Clinton【美国柯林顿总统】或您的 postmaster），然後它会确定位址中的主机名称可在 DNS中找得到。这个 script 跑起来不是很快，但至少有效。

不少 CGI scripts的作者使用另一个替代的方案：用一个简单的正规表示式，（如上头的那个）。如果一个位址能让这个式子对得上的话，那麽就接受这个位址。如果这个位址对不上这个式子的话，便再向使用者讯问，以确定她们填入的这个位址正确无误。

--------------------------------------------------------------------------------

如何解 MIME/BASE64字串？
MIME-tools套件（可自 CPAN取得）不但可处理这个问题而且有许多其他的功能。有了这个套件，解 BASE64码就变得像这麽容易：

use MIME::base64;
$decoded = decode_base64($encoded);

一个比较直接的解法是先做一点简单的转译，然後使用 unpack()这个函数的 ``u'' 格式：

tr#A-Za-z0-9+/##cd; #去除非 base64字元
tr#A-Za-z0-9+/# -_#; #转换成 uu码格式
$len = pack("c", 32 + 0.75*length); #计算长度字元
print unpack("u", $len . $_); # uu解码後 print

--------------------------------------------------------------------------------

如何根据使用者帐户名称自动合成 email位址？
在支援 getpwuid【UNIX系统呼叫】、 $add('From', 'gnat@frii.com');
$header->;add('Subject', 'Testing');
$header->;add('To', 'gnat@frii.com');
#制作本文
$body = 'This is a test, ignore';
#产生 mail物件
$mail = new Mail::Internet(undef, Header =>; $header, Body =>; /[$body]);
#送出
$mail->;smtpsend or die;

--------------------------------------------------------------------------------

如何找出我的主机名／网域名／IP位址？
长久以来许多 code都很草率地直接呼叫 `hostname`这个程式来取得主机名。虽然这麽做很方便，但也同时增加了移植到其他平台上的困难。这是一个很典型的例子，在方便和可移植性之间作抉择，不论选哪一边，必须付出一些牺牲和代价。

Sys::Hostname这个模组（标准 perl发行的一部分）可用来取得机器的名字，然後您便可利用 gethostbyname()这个系统呼叫来找出该机的 IP位址了（假定您的 DNS 运作正常）。

use Socket;
use Sys::Hostname;
my $host = hostname();
my $addr = inet_ntoa(scalar(gethostbyname($name || 'localhost')));

至少在 Unix底下，取得 DNS网域名最简单的方法大概要算是直接从 /etc/resolv.conf这个档案里面找。当然，这麽做的前提是 resolv.conf这个档案的设定必须照惯例的格式，还有就是这个档案必先存在才行。

（Perl在非 Unix系统下尚需要一有效的方法来测出机器和网域名）

--------------------------------------------------------------------------------

如何抓新闻讨论群的文章或群组名录？
使用 Net::NNTP或 News::NNTPClient模组，两者皆可自 CPAN下载。这些模组让抓群组名录这类的差事变得这麽容易：

perl -MNews::NNTPClient
-e 'print News::NNTPClient->;;new->;list("newsgroups"

'

--------------------------------------------------------------------------------

如何抓／丢 FTP档案？
LWP::Simple模组（可自 CPAN下载）可以抓，但不能丢档案。 Net::FTP模组（也可自 CPAN下载）虽比较复杂，但可用来丢、也能抓档案。

--------------------------------------------------------------------------------

如何用 Perl做 RPC？
有一个 DCE::RPC模组正在发展阶段（但尚未完成）。一旦完成後它会随着 DCE-Perl这个套件发行（可由 CPAN 下载）。至於 ONC::RPC这样的模组则还没听说有人在发展。

在此感谢萧百龄及两只老虎工作室的翻译

分享到：