unserialize():在偏移量时出错

我正在使用Hotaru CMS与图片上传插件,我得到这个错误,如果我尝试附加一个图像的职位,否则没有错误。

有问题的代码(与**一致的错误点):

/** * Retrieve submission step data * * @param $key - empty when setting * @return bool */ public function loadSubmitData($h, $key = '') { // delete everything in this table older than 30 minutes: $this->deleteTempData($h->db); if (!$key) { return false; } $cleanKey = preg_replace('/[^a-z0-9]+/','',$key); if (strcmp($key,$cleanKey) != 0) { return false; } else { $sql = "SELECT tempdata_value FROM " . TABLE_TEMPDATA . " WHERE tempdata_key = %s ORDER BY tempdata_updatedts DESC LIMIT 1"; $submitted_data = $h->db->get_var($h->db->prepare($sql, $key)); **if ($submitted_data) { return unserialize($submitted_data); } else { return false; }** } } 

从表中的数据,注意到结束位有图像信息,我不是PHP的专家,所以我想知道你们/ GAL可能会想什么?

tempdata_value:

 a:10:{s:16:"submit_editorial";b:0;s:15:"submit_orig_url";s:13:"www.bbc.co.uk";s:12:"submit_title";s:14:"No title found";s:14:"submit_content";s:12:"dnfsdkfjdfdf";s:15:"submit_category";i:2;s:11:"submit_tags";s:3:"bbc";s:9:"submit_id";b:0;s:16:"submit_subscribe";i:0;s:15:"submit_comments";s:4:"open";s:5:"image";s:19:"C:fakepath100.jpg";} 

编辑:我想我已经find了序列化位…

 /** * Save submission step data * * @return bool */ public function saveSubmitData($h) { // delete everything in this table older than 30 minutes: $this->deleteTempData($h->db); $sid = preg_replace('/[^a-z0-9]+/i', '', session_id()); $key = md5(microtime() . $sid . rand()); $sql = "INSERT INTO " . TABLE_TEMPDATA . " (tempdata_key, tempdata_value, tempdata_updateby) VALUES (%s,%s, %d)"; $h->db->query($h->db->prepare($sql, $key, serialize($h->vars['submitted_data']), $h->currentUser->id)); return $key; } 

unserialize() [function.unserialize]: Error at offset由于长度invalid serialization data unserialize() [function.unserialize]: Error at offsetinvalid serialization data

快速解决

你可以做的是recalculating the length序列化数组中元素recalculating the length

你目前的序列化数据

 $data = 'a:10:{s:16:"submit_editorial";b:0;s:15:"submit_orig_url";s:13:"www.bbc.co.uk";s:12:"submit_title";s:14:"No title found";s:14:"submit_content";s:12:"dnfsdkfjdfdf";s:15:"submit_category";i:2;s:11:"submit_tags";s:3:"bbc";s:9:"submit_id";b:0;s:16:"submit_subscribe";i:0;s:15:"submit_comments";s:4:"open";s:5:"image";s:19:"C:fakepath100.jpg";}'; 

没有重新计算的例子

 var_dump(unserialize($data)); 

产量

 Notice: unserialize() [function.unserialize]: Error at offset 337 of 338 bytes 

重新计算

 $data = preg_replace('!s:(\d+):"(.*?)";!e', "'s:'.strlen('$2').':\"$2\";'", $data); var_dump(unserialize($data)); 

产量

 array 'submit_editorial' => boolean false 'submit_orig_url' => string 'www.bbc.co.uk' (length=13) 'submit_title' => string 'No title found' (length=14) 'submit_content' => string 'dnfsdkfjdfdf' (length=12) 'submit_category' => int 2 'submit_tags' => string 'bbc' (length=3) 'submit_id' => boolean false 'submit_subscribe' => int 0 'submit_comments' => string 'open' (length=4) 'image' => string 'C:fakepath100.jpg' (length=17) 

build议 ..我

而不是使用这种快速解决scheme…我会build议你更新的问题

  • 你如何序列化你的数据

  • 你如何保存它..

================================编辑1 ================ ===============

错误

错误是由于使用双引号"而不是单引号"而产生' ,这就是为什么C:\fakepath\100.png被转换为C:fakepath100.jpg

解决这个错误

你需要改变$h->vars['submitted_data'] From(注意相当'

更换

  $h->vars['submitted_data']['image'] = "C:\fakepath\100.png" ; 

  $h->vars['submitted_data']['image'] = 'C:\fakepath\100.png' ; 

附加筛选器

在调用序列化之前,您还可以添加这个简单的filter

 function satitize(&$value, $key) { $value = addslashes($value); } array_walk($h->vars['submitted_data'], "satitize"); 

如果你有UTF汉字,你也可以运行

  $h->vars['submitted_data'] = array_map("utf8_encode",$h->vars['submitted_data']); 

如何在未来的序列化数据中检测问题

  findSerializeError ( $data1 ) ; 

产量

 Diffrence 9 != 7 -> ORD number 57 != 55 -> Line Number = 315 -> Section Data1 = pen";s:5:"image";s:19:"C:fakepath100.jpg -> Section Data2 = pen";s:5:"image";s:17:"C:fakepath100.jpg ^------- The Error (Element Length) 

findSerializeError函数

 function findSerializeError($data1) { echo "<pre>"; $data2 = preg_replace ( '!s:(\d+):"(.*?)";!e', "'s:'.strlen('$2').':\"$2\";'",$data1 ); $max = (strlen ( $data1 ) > strlen ( $data2 )) ? strlen ( $data1 ) : strlen ( $data2 ); echo $data1 . PHP_EOL; echo $data2 . PHP_EOL; for($i = 0; $i < $max; $i ++) { if (@$data1 {$i} !== @$data2 {$i}) { echo "Diffrence ", @$data1 {$i}, " != ", @$data2 {$i}, PHP_EOL; echo "\t-> ORD number ", ord ( @$data1 {$i} ), " != ", ord ( @$data2 {$i} ), PHP_EOL; echo "\t-> Line Number = $i" . PHP_EOL; $start = ($i - 20); $start = ($start < 0) ? 0 : $start; $length = 40; $point = $max - $i; if ($point < 20) { $rlength = 1; $rpoint = - $point; } else { $rpoint = $length - 20; $rlength = 1; } echo "\t-> Section Data1 = ", substr_replace ( substr ( $data1, $start, $length ), "<b style=\"color:green\">{$data1 {$i}}</b>", $rpoint, $rlength ), PHP_EOL; echo "\t-> Section Data2 = ", substr_replace ( substr ( $data2, $start, $length ), "<b style=\"color:red\">{$data2 {$i}}</b>", $rpoint, $rlength ), PHP_EOL; } } } 

更好的方法来保存到数据库

 $toDatabse = base64_encode(serialize($data)); // Save to database $fromDatabase = unserialize(base64_decode($data)); //Getting Save Format 

我没有足够的评论意见,所以我希望这是由使用上述“正确的”答案的人看到:

由于php 5.5 preg_replace()中的/ e修饰符已被完全弃用,上面的preg_match将会出错。 php文档build议在它的位置使用preg_match_callback。

请查找以下解决scheme,作为上述build议的preg_match的替代scheme。

 $fixed_data = preg_replace_callback ( '!s:(\d+):"(.*?)";!', function($match) { return ($match[1] == strlen($match[2])) ? $match[0] : 's:' . strlen($match[2]) . ':"' . $match[2] . '";'; },$bad_data ); 

还有一个原因是因为你不正确地把序列化的数据放到数据库里,反unserialize()失败了,请看这里的官方解释 。 由于serialize()返回二进制数据,而phpvariables不关心编码方法,所以把它放入TEXT,VARCHAR()会导致这个错误。

解决scheme:将序列化数据存储到表中的BLOB中。

这个错误是由于你的字符集错误而引起的。

打开标签后设置字符集:

 header('Content-Type: text/html; charset=utf-8'); 

并在你的数据库中设置字符集utf8:

 mysql_query("SET NAMES 'utf8'"); 

您可以使用以下函数修复破坏的序列化string,并使用多字节字符处理。

 function repairSerializeString($value) { $regex = '/s:([0-9]+):"(.*?)"/'; return preg_replace_callback( $regex, function($match) { return "s:".mb_strlen($match[2]).":\"".$match[2]."\""; }, $value ); } 
 $badData = 'a:2:{i:0;s:16:"as:45:"d"; Is \n";i:1;s:19:"as:45:"d"; Is \r\n";}'; 

您无法使用build议的正则expression式修复破坏的序列化string:

 $data = preg_replace('!s:(\d+):"(.*?)";!e', "'s:'.strlen('$2').':\"$2\";'", $badData); var_dump(@unserialize($data)); // Output: bool(false) // or $data = preg_replace_callback( '/s:(\d+):"(.*?)";/', function($m){ return 's:' . mb_strlen($m[2]) . ':"' . $m[2] . '";'; }, $badData ); var_dump(@unserialize($data)); // Output: bool(false) 

您可以使用以下正则expression式修复破坏的序列化string:

 $data = preg_replace_callback( '/(?<=^|\{|;)s:(\d+):\"(.*?)\";(?=[asbdiO]\:\d|N;|\}|$)/s', function($m){ return 's:' . mb_strlen($m[2]) . ':"' . $m[2] . '";'; }, $badData ); var_dump(@unserialize($data)); 

产量

 array(2) { [0] => string(17) "as:45:"d"; Is \n" [1] => string(19) "as:45:"d"; Is \r\n" } 

要么

 array(2) { [0] => string(16) "as:45:"d"; Is \n" [1] => string(18) "as:45:"d"; Is \r\n" } 

官方文档说它应该返回false并设置E_NOTICE

但是由于您有错误,所以错误报告被设置为由E_NOTICE触发

这里是一个修复,允许你检测由反unserialize返回的假

 $old_err=error_reporting(); error_reporting($old_err & ~E_NOTICE); $object = unserialize($serialized_data); error_reporting($old_err); 

你可能要考虑使用base64编码/解码

 $string=base64_encode(serialize($obj)); unserialize(base64_decode($string)); 

在我的情况下,我在MySQL数据库的BLOB字段中存储序列化的数据,显然是不够大,包含整个值,并截断它。 这样的一个string显然不能被反序列化。
一旦将该字段转换为MEDIUMBLOB ,问题就消除了。 也可能需要将表选项ROW_FORMAT切换到DYNAMICCOMPRESSED

快速解决

重新计算序列化数组中元素的长度 – 但不要使用(preg_replace)它已被弃用 – 更好地使用preg_replace_callback:

 $data = preg_replace_callback('!s:(\d+):"(.*?)";!', function($m) { return 's:'.strlen($m[2]).':"'.$m[2].'";'; }, $data); 

您将不得不将sorting规则types更改为utf8_unicode_ci ,问题将得到解决。

这个问题的另一个原因可以是“有效载荷”会话表的列types。 如果你有大量的会话数据,文本列是不够的。 您将需要MEDIUMTEXT甚至LONGTEXT。

我在反序列化数据时遇到同样的问题。 发现如果在任何数组值中有一个“,”,:,或者;序列化会被破坏,我有一个:在我的数组中,所以删除它,它是固定的。

希望它可以帮助别人。

在这个页面上尝试了一些没有成功的东西之后,我查看了页面源代码,并且说明了序列化string中的所有引号都被html实体replace了。 解码这些实体有助于避免太多头痛:

 $myVar = html_entity_decode($myVar);