MyException - 我的异常网
当前位置:我的异常网» 移动开发 » 将英文句子拆成一个个单纯词(对于句子中可能出现的

将英文句子拆成一个个单纯词(对于句子中可能出现的不同情况)

www.MyException.Cn  网友分享于:2015-02-11  浏览:0次
将英文句子拆成一个个单词(对于句子中可能出现的不同情况)

最近有个需求,后台给我一个英文句子,我要把其中每个单词拆出来,然后计算出单词的个数,把每个单词布局到一个个横线上。  有的人会想,很好搞啊,直接以空格去拆分就得了,然后再判断每个单词的最后一个字符是不是逗号等符号,是的话去掉。

这样做的话,那得要求后台的英文句子高度标准,假如句子里有连续的两个空格怎么办,这个时候拆分出来的单词就会出现空格,单词数就会不准确。这个还好说,有解决方法:如果判断出单词是空格的话,去掉就好。可是另外一种情况,比如句子是 “Yeah,I need a word”。Yeah 和 I 之间只有逗号,没有空格,这个时候如果再去做判断就显得很麻烦。。更何况后台给出的问题情况多种多样,你懂的。。根本无法单纯的用以空格进行拆分的方法去解决这个问题。所以怎么解决呢?  对,逐个字符遍历的方法。 现列出两种方法,两种方法的思路是一样的。。

假如句子就是:

 NSString *sentence = @"Yeah,...I need  a world.";

方法一:

- (NSMutableArray *)componentsWithString:(NSString *)str

{

    NSMutableArray *wordArray = [NSMutableArray array];

    

    NSString *wordStr = @"";

    

    for (int y = 0;y < str.length; y++) {

        //利用截取字符串的方法截取出每个字符

        NSString *string1 = [str substringFromIndex:y];

        NSString *string2 = [string1 substringToIndex:1];

        //转化为字符的形式,此处编码方式可以是NSUTF8StringEncoding

        const char *s = [string2 cStringUsingEncoding:NSASCIIStringEncoding];

       //判断是不是字母

      //针对于上引号’这种情况:s[0]=='\''

      //针对于有短横线 - 这种情况:str[0]=='-'

        if ((s[0] >=65 && s[0]<=90) || (s[0]>=97 && s[0]<=122) || s[0]=='\'' || str[0]=='-') {

            NSString *string = [NSString stringWithCString:s encoding:NSUTF8StringEncoding];

            wordStr = [wordStr stringByAppendingString:string];

        }else {

            if (wordStr.length > 0) {

                [wordArray addObject:wordStr];

            }

            wordStr = @"";

        }

    }

    return wordArray;

}


方法二:

- (NSMutableArray *)componentsWithString1:(NSString *)str

{

    NSMutableArray *wordArray = [NSMutableArray array];

    

    NSString *wordStr = @"";

    

    for (int k=0; k<strlen(str.UTF8String); k++) {

        if ((str.UTF8String[k] >= 97 && str.UTF8String[k] <= 122)|| (str.UTF8String[k] >= 65 && str.UTF8String[k] <= 97 || (str.UTF8String[k]=='\'') || (str.UTF8String[k]=='-' )) {

            wordStr = [wordStr stringByAppendingFormat:@"%c",str.UTF8String[k]];

        }else {

            if (wordStr.length > 0) {

                [wordArray addObject:wordStr];

                wordStr = @"";

            }

        }

    }

    return wordArray;

}


从以上可以看出,方法二较为简便,推荐用方法二。


文章评论

程序员的一天:一寸光阴一寸金
程序员的一天:一寸光阴一寸金
我是如何打败拖延症的
我是如何打败拖延症的
一个程序员的时间管理
一个程序员的时间管理
中美印日四国程序员比较
中美印日四国程序员比较
程序猿的崛起——Growth Hacker
程序猿的崛起——Growth Hacker
漫画:程序员的工作
漫画:程序员的工作
初级 vs 高级开发者 哪个性价比更高?
初级 vs 高级开发者 哪个性价比更高?
Java 与 .NET 的平台发展之争
Java 与 .NET 的平台发展之争
“肮脏的”IT工作排行榜
“肮脏的”IT工作排行榜
如何区分一个程序员是“老手“还是“新手“?
如何区分一个程序员是“老手“还是“新手“?
10个帮程序员减压放松的网站
10个帮程序员减压放松的网站
那些争议最大的编程观点
那些争议最大的编程观点
团队中“技术大拿”并非越多越好
团队中“技术大拿”并非越多越好
那些性感的让人尖叫的程序员
那些性感的让人尖叫的程序员
每天工作4小时的程序员
每天工作4小时的程序员
60个开发者不容错过的免费资源库
60个开发者不容错过的免费资源库
当下全球最炙手可热的八位少年创业者
当下全球最炙手可热的八位少年创业者
程序员眼里IE浏览器是什么样的
程序员眼里IE浏览器是什么样的
老程序员的下场
老程序员的下场
我跳槽是因为他们的显示器更大
我跳槽是因为他们的显示器更大
程序员应该关注的一些事儿
程序员应该关注的一些事儿
旅行,写作,编程
旅行,写作,编程
亲爱的项目经理,我恨你
亲爱的项目经理,我恨你
2013年美国开发者薪资调查报告
2013年美国开发者薪资调查报告
什么才是优秀的用户界面设计
什么才是优秀的用户界面设计
程序员必看的十大电影
程序员必看的十大电影
我的丈夫是个程序员
我的丈夫是个程序员
程序员都该阅读的书
程序员都该阅读的书
聊聊HTTPS和SSL/TLS协议
聊聊HTTPS和SSL/TLS协议
程序员和编码员之间的区别
程序员和编码员之间的区别
Web开发者需具备的8个好习惯
Web开发者需具备的8个好习惯
Google伦敦新总部 犹如星级庄园
Google伦敦新总部 犹如星级庄园
程序员最害怕的5件事 你中招了吗?
程序员最害怕的5件事 你中招了吗?
不懂技术不要对懂技术的人说这很容易实现
不懂技术不要对懂技术的人说这很容易实现
5款最佳正则表达式编辑调试器
5款最佳正则表达式编辑调试器
十大编程算法助程序员走上高手之路
十大编程算法助程序员走上高手之路
如何成为一名黑客
如何成为一名黑客
老美怎么看待阿里赴美上市
老美怎么看待阿里赴美上市
程序员周末都喜欢做什么?
程序员周末都喜欢做什么?
程序员的鄙视链
程序员的鄙视链
看13位CEO、创始人和高管如何提高工作效率
看13位CEO、创始人和高管如何提高工作效率
10个调试和排错的小建议
10个调试和排错的小建议
 程序员的样子
程序员的样子
要嫁就嫁程序猿—钱多话少死的早
要嫁就嫁程序猿—钱多话少死的早
编程语言是女人
编程语言是女人
“懒”出效率是程序员的美德
“懒”出效率是程序员的美德
Web开发人员为什么越来越懒了?
Web开发人员为什么越来越懒了?
鲜为人知的编程真相
鲜为人知的编程真相
写给自己也写给你 自己到底该何去何从
写给自己也写给你 自己到底该何去何从
软件开发程序错误异常ExceptionCopyright © 2009-2015 MyException 版权所有