PHP 计算汉明距离总和
两个整数的 汉明距离 指的是这两个数字的二进制数对应位不同的数量。
计算一个数组中,任意两个数之间汉明距离的总和。
示例:
输入: 4, 14, 2
输出: 6
解释: 在二进制表示中,4表示为0100,14表示为1110,2表示为0010。(这样表示是为了体现后四位之间关系)
所以答案为:
HammingDistance(4, 14) + HammingDistance(4, 2) + HammingDistance(14, 2) = 2 + 2 + 2 = 6.
注意:
- 数组中元素的范围为从
0
到10^9
。 - 数组的长度不超过
10^4
。
来源:力扣(LeetCode) 链接:477. Total Hamming Distance
解题思路 1
穷举两两组合的数量,然后累加汉明距离,这个是最简单直白的方案。
结果是大量数据的时候会超时,阶乘的数量太多。
代码
class Solution {
/**
* @param Integer[] $nums
* @return Integer
*/
function totalHammingDistance($nums) {
$count = count($nums);
$sum = 0;
for ($i = 0; $i < $count - 1; $i++) {
for ($j = $i+1; $j < $count; $j++)
{
$sum += $this->hm($nums[$i], $nums[$j]);
}
}
return $sum;
}
// 汉明距离方法
function hm($x, $y)
{
return substr_count(decbin($x ^ $y), '1');
}
}
解题思路 2 - 竖着计算
我们经常会这样分析问题:最简单的情况 -> 一般的、复杂的情况。之前我们是:遍历所有可能的两两组合。
现在我们换一个角度看:如果int
只有1位-> int
有32位。
首先,如果 int
只有 1 位,即数组 nums
中的元素只有两种情况,0 或者 1,此时求汉明距离总和的步骤如下:
- 首先将数组分成两组,全 0 位一组,全 1 位一组
- 将两组数两两组合,记一个为a,一个为b
- 如果 a、b 均来自 0 那一组,或者均来自 1 那一组,此时不会有汉明距离产生。但是如果 a、b 一个来自 0 那一组,另外一个来自1那一组,这时将会产生汉明距离
- 假设
nums
数组元素个数为n
,其中 0 元素个数为k
,则 1 元素的个数为n-k
,则上一步能够产生汉明距离的总和就是k*(n-k)
k*(n-k)
就是int
只有 1 位的情况下的汉明距离总和
如果将 int
的位数从 1 位扩展到 32 位,那么就是将遍历每一位,然后求出在这一位上的汉明距离和,累加到一起,这样可以将算法复杂度从 $O(N^2)$ 降低到 $O(32\times N)$,即为 $O(N)$。
可以看下面这个例子:
十进制 二进制
4: 0 1 0 0
14: 1 1 1 0
2: 0 0 1 0
1: 0 0 0 1
先看最后一列,有三个 0 和一个 1,那么它们之间相互的汉明距离就是 3,即 1 和其他三个 0 分别的距离累加,然后在看第三列,累加汉明距离为 4,因为每个 1 都会跟两个 0 产生两个汉明距离,同理第二列也是 4,第一列是 3。各列相互之间两两组合的汉明距离总和就是各列 0 的个数与 1 的个数之和,把各列汉明距离总和再累加就是题目所求的数组 nums
元素两两之间的汉明距离总和。
代码
class Solution {
/**
* @param Integer[] $nums
* @return Integer
*/
function totalHammingDistance($nums) {
$count = count($nums);
$sum = 0;
for($i = 0; $i < 32; $i++)
{
$tmpCount = 0;
for($j = 0; $j < $count; $j++)
{
$tmpCount += ($nums[$j] >> $i) & 1;
}
$sum += $tmpCount * ($count - $tmpCount);
}
return $sum;
}
}
参考链接