`
walksing
  • 浏览: 211886 次
  • 性别: Icon_minigender_1
  • 来自: 深圳
社区版块
存档分类
最新评论

公司升级服务器小结

阅读更多
[原创]公司升级服务器小结   Post By:2011-4-2 13:23:44    Post IP:113.97.200.226

易经有云万事万物相关性。
你能想到,俩会会影响到海外通道吗? 这八竿子打不着的东西。我们遇上了。

去联通机房下线服务器,联通理由;俩会维稳 封网。封就封吧,好在钱也交了;就折腾到月底吧。正好,这期间,我们也在测试mysql数据库并发情况。

在期间发生了些事情

总结如下:
1) 商务失职 责任心不强
      第一次割接出现下行失败问题 大概1000多条 。是因海外没有严格依据ip鉴权 当时列出一些通道失败情况要求商务跟进解决 (没人跟进)

     这直接为第2次切换埋下了隐患。

2) 海外商务应急能力差 
   第2次切换是ip临时公布的我人在机房 。海外反映迟钝,说客户睡觉云云。这事同样发生在我们之前;原ip是临时发现部分国家不通;机房请求我们更换ip。包括mail dns 都是临时换的。就是跟时间赛跑,抢收入。能抢回多少抢回多少,dns 2小时生效;之前也是ip地址接口;后汲取教训改用域名接口。管你客户是在睡觉干啥。都是电话联系,不到2小时搞定,唯一一家没搞定的是量比较少。发邮件了;当时没保留对方电话,哪个也是3小时对方上班后看到邮件搞定的。

   反观,差距如此明显。最重要是责任心不强。出了问题,我可以推卸责任。往技术上推,你没提前通知我。呵呵呵,无语。

3)海外商务只是传话筒
    在跟国外客户解析ip鉴权问题,换域名问题 好像这些是只是技术问题 。商务不过问细节。
    在这之前商务同样的问题,他们会想,dns是什么东西。为何要用dns,为何要加ip鉴权 弄清所以然。而我们呢?一个问题要翻来覆去解析,自己不会google?
   
    这两天烦得我牙疼。

4)公司职责不清 ,赏罚不分明
     这是最大的问题。说白了;没有跨部门之间的调度权限 ,没有奖罚分明的权利。 比如升级服务器问题。如果赋予我奖罚分明的权利。
     对应怠慢,消极者开除权限,谁敢不听?对应尽职为公司服务的就应该奖励,徐楠晚上为赶进度,在家加班00:00 测试mysql服务器;

     所谓项目制,看起来是一个摆设。一定要立项目才叫项目制?
     我说一句,商务会乐呵呵的回你10句。  就好比,一个将军没有指挥权。将军再大的神通也没用。
    一个公司要做大,要敢于下放权限。


5)关于这次技术的切换问题的方案 回滚
    这是正常的操作流程;我曾担任过139手机邮箱系统割接过程;曾先后7-10次通宵加班割接,无过错。而现在只是一个服务器的切换,岂能阴沟翻船?


    比如第一次3月初割接失败, 回滚 。这是很正常的操作,不要大惊小怪。不出问题那叫神仙,这次出问题就是造成1000多条下行失败损失,后发现系统调度慢,立马回滚。

    导致那次失败,主要是之前的那套mysql安装源码找不到了;徐楠从网上找到另外一个版本,而我事先也不知道。
    之后,先后经历,jdk版本不同也同样问题。重新下载同一版本jdk ,wrapper.jar 版本又从.8服务器进行了同步。重新测试过各种版本服务器,都失败;然后,
    我又决定让徐楠网上下了 同样版本的mysql源码编译安装搞定。这期间经历的困难可想而知。遇到这样的问题,没别的路,只能一步步排除法,排查。先后排查了jdk, wrapper.jar 环境;后排查了mysql . 好在,我们系统ppg模型有一个调度,能够自动现实执行数据库调度时间的日志,在做并发测试时,徐楠又找到一个小巧的java并发测试工具。为防止再出错,编译mysql源码过程中,我亲自编译。

经过测试,系统调度过程处理1条的时间是2-8ms 这个速度是日调度1亿级的处理速度,而目前线上的也是这速度。正好也验证了smg引擎的优良性。而在之前的没编译的mysql数据库 是3000-5000ms 1条。 速度提高了1000倍。而这一天,正是2011-03-31 最后一天了。好像,正在等待天时。万幸,所付出的努力终于获得了收获。

6) 多次切换原因

  A)  2.28 日月末 第一次切换  当时目的希望为公司节省成本 (当月服务器搬迁 ,新机房送1一个月免费)  ;后发现mysql版本不同,导致调度缓慢 第一次回滚
  B)  3.4日  第2次切换  后更换mysql 但没编译(因3月4日扣款,仍希望节省成本) 后仍然发现调度缓慢 但箭在线上, 不得不发。当日早上,通知公司后勤 上 午要搬迁服务器 更换机房 。电话方知道,需要提前3天申请下线 (第一次遇到联通这么bt);计划取消, 执行第2次回滚。
   后因俩会延迟到15日 俩会结束 等审批(21-23日得通知,已经通过审批服务器下架,但期间,后台技术在抓紧修复测试mysql问题,又考虑到成本,反正钱已经支付,索性坚持到月底搬迁 ,这期间有节约成本考虑,更重要的技术仍然没找到mysql调度缓慢原因)
  C) 3.30日凌晨 我在家里编译好,安排徐楠线上测试,虽然调度失败,但从执行时间来看处理时间是8ms 速度大大加快。调度失败是因为部分表,过程,没导入。 暂通知徐楠休息。第2天再搞 ;上午导入完整过程表,测试 调度成功,调度一条记录执行时间介于2-8ms 到达理想预期。至此,成功。上午切换,dns生效2小时 ,31日上午搬迁服务器,下午切换,期间商务多有配合不力,但总算无大过错;国内失败是因为忘记通知对方对新ip做鉴权 ,但影响不大,可顺利补发失败数据。
   

    原计划更改239服务器ip ,更改理由 239,209 不能在外网ip 互访 。经过跟机房协商 等4台服务器到齐放1个机柜。但在实际运作过程发现,原来8,9服务器搬迁过来后,变为228,227 因分配的网段不同,可以互访 ;后又申请机房将209 (无业务)更换ip ,215 后,可以达到互访另外3台,故原计划撤销239(临时跑通道业务)的方案取消,这台服务器也没放在同一机柜(我们期望只要能达到4台服务器之间能够外网Ip互访即可)。
 
(  这里有点小插曲,原来8,9两台服务器2U ;而我事先不知情; 后联系机房业务,因跟我之间有多次业务往来,后免去2U额外占机费。)

d) 3.31日 中午12:00 机房 在8,9 服务器分配Ip,后进行dns切换。经过测试大部分通道已经顺利割接,剩余1,2个小通道量不大 也在次日顺利割接。至此割接完成

7) 数据整合
预计 4.2-4.7日前, 会将3月来回切换的几个服务器数据整理回一个.8 (228)数据库服务器,重新生成美元账单。




分享到:
评论

相关推荐

    服务器设备巡查内容(服务器设备维保资料).doc

    1 巡查周期 我公司技术服务有限公司为贵单位提供乙方应提供7×24全天技术支持服务,并根据甲方 的需要提供现场支持服务。具体服务时间由甲方需求决定,服务响应时间按本招标文件 第四点要求施行。 1. 确保本次保修...

    opc服务器.doc

    3、再考虑到实时监控系统往往需要升级和调整。 4、就需要各子系统具备统一的开放接口。 5、OPC(OLE for Process Control) 规范正是这一思维的产物。 6、OPC 基于Microsoft公司的 Distributed interNet Application ...

    LINUX操作系统(电子教案,参考答案)

    小结 8 习题一 8 一、思考题 8 二、选择题 9 三、上机操作 9 第2章 基本操作 10 2.1 进入Linux系统 10 2.1.1 开机与系统选择 10 2.1.2 注册 10 2.1.3 控制和终端操作 11 2.1.4 进入图形界面 11 2.1.5 用Telnet方式...

    HttpWebRequest和HttpWebResponse用法小结

    实现思路 在每个系统出写入报告错误代码(找个合理的理由,比如系统免费升级) -> 自家服务器接收并处理错误报告 -> 反馈用户(解决掉BUG就行,不要太声扬) 基础回顾 —参考msdn 1.HttpWebRequest类:提供WebRequest类...

    php网络开发完全手册

    1.7 小结 23 第2章 PHP的基础语法 24 2.1 语言构成与工作原理 24 2.2 常量与变量 25 2.2.1 常量的定义 25 2.2.2 变量的定义 26 2.2.3 变量的作用域 27 2.2.4 动态变量 29 2.3 运算符和关键字 29 2.4 流程控制语法 30...

    visio教程PDF

    1.7 小结 第2章 Visio 2000工程环境 2.1 操作Welcome to Visio 2000窗口 2.1.1 难备新的绘图 2.1.2 准备打开一个已经存在的文件 2.2 基本下拉菜单 2.2.1 File下拉菜单 2.2.2 Tools下拉菜单 ...

    Visio 2000 技术大全

    1.7 小结 第2章 Visio 2000工程环境 2.1 操作Welcome to Visio 2000窗口 2.1.1 难备新的绘图 2.1.2 准备打开一个已经存在的文件 2.2 基本下拉菜单 2.2.1 File下拉菜单 2.2.2 Tools下拉...

    PHPWeb开发技术指南——pdf格式

    1.7 小结 22 第2章 高级语法 23 2.1 PHP语法 23 2.2 定义常量 24 2.3 数组函数 25 2.4 PHP和OOP 31 2.4.1 类:PHP 3.0和PHP 4.0的对比 35 2.4.2 执行类 36 2.4.3 读取对象 37 2.4.4 构造函数 38 2.4.5 继承 38 2.4.6...

    PHP4.0 高级篇

    1.7 小结 22 第2章 高级语法 23 2.1 PHP语法 23 2.2 定义常量 24 2.3 数组函数 25 2.4 PHP和OOP 31 2.4.1 类:PHP 3.0和PHP 4.0的对比 35 2.4.2 执行类 36 2.4.3 读取对象 37 2.4.4 构造函数 38 2.4.5 继承 38 2.4.6...

    Linux 中 RPM包 安装 查询 卸载命令小结及yum命令详解

    RPM 的全称为Redhat Package Manager ,是由Redhat 公司提出的,用于管理Linux 下软件包的软件。Linux 安装时,除了几个核心模块以外,其余几乎所有的模块均通过RPM 完成安装。RPM 有五种操作模式,分别为:安装、...

    SQL.Server.2008编程入门经典(第3版).part1.rar

    1.4 本章小结 第2章 SQL Server管理工具 2.1 联机丛书 2.2 SQLServer配置管理器 2.2.1 服务管理 2.2.2 网络配置 2.2.3 协议 2.2.4 客户端 2.3 SQLServer Management Studio 2.3.1 启动Management Studio 2.3.2 ...

    SQL.Server.2008编程入门经典(第3版).part2.rar

    1.4 本章小结 第2章 SQL Server管理工具 2.1 联机丛书 2.2 SQLServer配置管理器 2.2.1 服务管理 2.2.2 网络配置 2.2.3 协议 2.2.4 客户端 2.3 SQLServer Management Studio 2.3.1 启动Management Studio 2.3.2 ...

    安防天下智能网络视频监控技术详解与实践part2

    2.8 本章小结 41 第3章 视频编码压缩技术 43 3.1 多媒体技术基础 44 3.1.1 图像的色彩模型 44 3.1.2 图像的色彩空间变换 46 3.1.3 图像的基本属性 47 3.1.4 图像的格式与质量 48 3.1.5 数据压缩方法 ...

    安防天下智能网络视频监控技术详解与实践.part3

    2.8 本章小结 41 第3章 视频编码压缩技术 43 3.1 多媒体技术基础 44 3.1.1 图像的色彩模型 44 3.1.2 图像的色彩空间变换 46 3.1.3 图像的基本属性 47 3.1.4 图像的格式与质量 48 3.1.5 数据压缩方法 49 3.2 ...

    安防天下智能网络视频监控技术详解与实践part1

    2.8 本章小结 41 第3章 视频编码压缩技术 43 3.1 多媒体技术基础 44 3.1.1 图像的色彩模型 44 3.1.2 图像的色彩空间变换 46 3.1.3 图像的基本属性 47 3.1.4 图像的格式与质量 48 3.1.5 数据压缩方法 ...

    JINI 核心技术

    5.2.7 小结 69 5.3 第一个Jini程序:Hello, World 69 5.3.1 实现服务代理 72 5.3.2 “包装”应用程序 73 5.3.3 使用发现和查找 75 5.3.4 其他细节 76 5.3.5 使用服务模板来寻找服务 78 5.3.6 查找一个服务 79 5.3.7 ...

    JINI核心技术

    5.2.7 小结 69 5.3 第一个Jini程序:Hello, World 69 5.3.1 实现服务代理 72 5.3.2 “包装”应用程序 73 5.3.3 使用发现和查找 75 5.3.4 其他细节 76 5.3.5 使用服务模板来寻找服务 78 5.3.6 查找一个服务 79 5.3.7 ...

    SQLServer2008查询性能优化 2/2

    1.6 小结 14 第2章 系统性能分析 15 2.1 性能监视器工具 15 2.2 动态管理视图 17 2.3 硬件资源瓶颈 18 2.3.1 识别瓶颈 18 2.3.2 瓶颈解决方案 19 2.4 内存瓶颈分析 19 2.4.1 SQL Server内存管理 20 2.4.2 ...

    SQLServer2008查询性能优化 1/2

    1.6 小结 14 第2章 系统性能分析 15 2.1 性能监视器工具 15 2.2 动态管理视图 17 2.3 硬件资源瓶颈 18 2.3.1 识别瓶颈 18 2.3.2 瓶颈解决方案 19 2.4 内存瓶颈分析 19 2.4.1 SQL Server内存管理 20 2.4.2 ...

Global site tag (gtag.js) - Google Analytics